互联网资讯 / 营销 · 2024年4月25日

构建高质量用户画像的4个关键标签

用户画像能不能提升付费率?肯定能,问题是:怎么干?

前几天就有同学A,在面试的时候遇到这个问题。同学A举手:这题我会!构建RFM模型,把用户分成27类,然后重要价值客户(111)给予VIP资格,重要保持客户(011)要主动保持联系&hellIP;&hellIP;熟练地背诵出27类的做法。

结果,被面试官直接挂掉!

一、谈用户标签,先谈场景

首先,每种分析方法,是有特定业务场景限制的。从本质上看,网上盛传的RFM做法,只适合高频互动的零售电商业务的场景,比如耐用品、母婴、医疗、保健、游戏、影视娱乐等,都不适合RFM。而这位同学正撞枪口上了:他面的是小说阅读app。

小说业务,其付费的动力是高度内容驱动的。想让用户掏钱,至少得有内容让用户看得爽。想让用户看得爽,得知道用户喜欢什么样的内容题材。这是用户画像要解决的一个问题。

同样是内容,小说又不同于短视频或者直播。用户的爽快感,不是直接被屏幕上扭来扭去的小姐姐或者喋声喋气的“乌鸡哥&Rdquo;激发的,而是在持续阅读过程中,在沉浸式的体验中获得的。

这样就形成了一个逐步沉浸的转化过程:寻找内容&RaRR;点击阅读&RaRR;持续阅读&RaRR;付费页面&RaRR;付费&RaRR;持续付费。因此,定位用户当前所处的阶段,引导用户向下一阶段发展,是用户画像要解决的第二问题。

此时,可以进一步去想:从小说阅读app里,能获取何种用户标签,构建用户画像了。

二、基础属性标签

一提到用户画像,很多同学又会说贯口一样说出:性别、年龄、职业、收入、爱好&hellIP;&hellIP;只要做一个信息收集表,就能搞掂啦!

实际上确实有场景可以用表单收集。比如:

母婴产品:BB出生月份数、BB健康情况

少儿教育:年龄、年级、科目(英语/语文/奥数)、目的

物流货运:货物类型、货物重量、出发地、达到地、时间要求

家政服务:家庭位置,服务内容(保姆/清洁/护理),上门时间

医疗保健:年龄、性别、身体状况、病史

但是,这些表单是建立在业务本身的刚需之上。没有这些信息,服务根本开展不了。所以这种表单信息能受到用户的理解和配合,采集难度也相对较低,复核起来也容易。

在小说这个场景里,就不适合用表单收集。

因为对小说的“爱好&Rdquo;根本没啥刚需可言:

爱好是多个因素综合组成,不能直接用一两个问题问清楚

爱好不是简单1+1=2,喜欢穿越,喜欢三国,不代表喜欢“穿越去三国&Rdquo;

爱好并不是完全固定的,有可能被新题材、热门榜单、朋友推荐等引导

更不要提其他涉及个人隐私信息,难道看小说还需要被查户口?不受用户理解,即使强行采集,数据也是假的。

因此设计表单的时候,要保持克制,尽量找关键字段。对阅读而言,男女差异很大,且容易受到用户理解,因此可以在表单采集。并且男女,是个符合MECE的简单选项,不容易引起歧义。

换个角度,如果收集的是:阅读兴趣。

选项是:玄幻、历史、穿越、言情、霸道总裁、其他。

用户很容易引起歧义,比如玄幻+穿越的,算哪类?比如大女主算哪类?用户在有歧义的时候,就会乱填一通,收集回来的数据就有问题。这些细节看似琐碎,实则决定了基础属性标签的准确度。

三、关键行为标签

要定位用户当前所处的阶段,需要找能区分用户类型的最关键标签。既然目标是提升付费率,因此付费相关标签,就是第一重要的。根据用户付费记录,可以区分三个状态:从未付费/付费一本小说/付费2本及以上。引导方向也很清晰(如下图)。

4大标签,构建高质量用户画像

注意,上边分类里,有一个策略是导向:保持本篇续订。这就意味着,需要观察用户在阅读小说时候的进度。

如果付费的小说已经完结了/断更了,就得及时推荐新内容;如果用户根本连看都看不下去,或者已经愤然弃坑,那也得另寻好内容推荐。因此得再考虑用户阅读行为标签。

四、分层行为标签

用户阅读行为对付费意义很重大。理论上,只有入坑的用户才会付费,还很有可能对更多其他感兴趣内容付费。对还没入坑的要尽快拖进坑里,已经脱坑的要防止流失。因此,区分出未入坑、入坑、脱坑状态,很重要。

“入坑&Rdquo;是对读者沉迷在某本小说情节的俗称。做标签定义可不能这么随便,要有具体的指标+计算公式+业务含义,才能算一个标签。

用户如果入坑了,最起码的要求是在小说app的登录时长、登录频次有一定保证,因此可以选用比如最近一周内登录次数/登录总时长,来区分用户平台活跃的轻、中、重(如下图)。

4大标签,构建高质量用户画像

再次,如果用户入坑了一个内容,那么他肯定不会东瞄西逛,而会聚焦在一个内容里。那么这个内容占他在平台活跃时间的比例,一定相当长。

这样可以将用户是否聚焦一个内容的标签区分出来:

无感:没有一个长时间活跃的内容

专一:有一个长时间活跃内容

博爱:有多个长时间活跃内容

具体多长算长,也得用分层分析法哦。

用户阅读行为对付费意义很重大。理论上,只有入坑的用户才会付费,还很有可能对更多其他感兴趣内容付费。对还没入坑的要尽快拖进坑里,已经脱坑的要防止流失。因此,区分出未入坑、入坑、脱坑状态,很重要。

“入坑&Rdquo;是对读者沉迷在某本小说情节的俗称。做标签定义可不能这么随便,要有具体的指标+计算公式+业务含义,才能算一个标签。

用户如果入坑了,最起码的要求是在小说app的登录时长、登录频次有一定保证,因此可以选用比如最近一周内登录次数/登录总时长,来区分用户平台活跃的轻、中、重(如下图)。

这些都有可能发生,而且会让数据分析变简单。但是在构造标签逻辑的时候,也要符合MECE方法,才能避免意外发生,这是专业数据分析人员与业务人员思考问题的本质区别:业务人员能直接抓最显眼的,数据则关注情况全面性与严谨性。

五、兴趣偏好标签

上文有提到,直接收集兴趣会有各种问题。那还能怎么办呢?当然可以从用户行为中提炼兴趣。如果一个用户入坑了某个内容,那他肯定是对这个内容感兴趣的。

这里的难点,在于区分:他到底对哪个点感兴趣。因为一个内容相关的静态标签太多了:作者、主题、风格、评论、是否热门、写法&hellIP;&hellIP;还有很多无法标准化的部分。

因此从一开始,就不能太指望兴趣标签做得特别精准,而是要结合小说的品类特点,把同款、交叉款单品选出来,找到贴近的单品即可。毕竟小说不是短视频,不需要15秒一切换。

当兴趣偏好与付费行为交叉,还会产生一种可能:有一类用户就是坚持白嫖,有很多关联阅读行为,但是就是不付钱。此时可用优惠券测试,把其中价格敏感型与真正白嫖到底的区分开,从而形成价格偏好标签。

六、输出策略

有了以上基础的标签准备,最终输出策略时就可以像搭积木一般,针对用户需求,组合出各种策略,只要基础打得牢,出结果是手到擒来的事(如下图)。

4大标签,构建高质量用户画像

七、小结

很多同学习惯了做网上的现成数据集。所谓的用户画像,大部分是现成的字段,尤其以直接收集的表单字段居多。

这种现成的数据集练手很爽,可与实际情况差距非常大。实际工作中,即使能用表单采集,也得考虑采集过程中错误、造假、复核问题。

更不用说,相当多数据标签需要通过分析计算+测试获得,需要一层层的构造,由简单到复杂。这些处理过程中技巧与手段,才是真正值钱的技能与能力,与大家共勉。

OpenMagic API

Need more than content? Move into the product flow.

If you are here for model access, pricing, developer docs, or the future API console, the dedicated product path now lives on api.openmagic.ai.