构建高质量用户画像的4个关键标签

用户画像能不能提升付费率？肯定能，问题是：怎么干？

前几天就有同学A，在面试的时候遇到这个问题。同学A举手：这题我会！构建RFM模型，把用户分成27类，然后重要价值客户（111）给予VIP资格，重要保持客户（011）要主动保持联系&hellIP;&hellIP;熟练地背诵出27类的做法。

结果，被面试官直接挂掉！

一、谈用户标签，先谈场景

首先，每种分析方法，是有特定业务场景限制的。从本质上看，网上盛传的RFM做法，只适合高频互动的零售电商业务的场景，比如耐用品、母婴、医疗、保健、游戏、影视娱乐等，都不适合RFM。而这位同学正撞枪口上了：他面的是小说阅读app。

小说业务，其付费的动力是高度内容驱动的。想让用户掏钱，至少得有内容让用户看得爽。想让用户看得爽，得知道用户喜欢什么样的内容题材。这是用户画像要解决的一个问题。

同样是内容，小说又不同于短视频或者直播。用户的爽快感，不是直接被屏幕上扭来扭去的小姐姐或者喋声喋气的“乌鸡哥&Rdquo;激发的，而是在持续阅读过程中，在沉浸式的体验中获得的。

这样就形成了一个逐步沉浸的转化过程：寻找内容&RaRR;点击阅读&RaRR;持续阅读&RaRR;付费页面&RaRR;付费&RaRR;持续付费。因此，定位用户当前所处的阶段，引导用户向下一阶段发展，是用户画像要解决的第二问题。

此时，可以进一步去想：从小说阅读app里，能获取何种用户标签，构建用户画像了。

二、基础属性标签

一提到用户画像，很多同学又会说贯口一样说出：性别、年龄、职业、收入、爱好&hellIP;&hellIP;只要做一个信息收集表，就能搞掂啦！

实际上确实有场景可以用表单收集。比如：

母婴产品：BB出生月份数、BB健康情况

少儿教育：年龄、年级、科目（英语/语文/奥数）、目的

物流货运：货物类型、货物重量、出发地、达到地、时间要求

家政服务：家庭位置，服务内容（保姆/清洁/护理），上门时间

医疗保健：年龄、性别、身体状况、病史

但是，这些表单是建立在业务本身的刚需之上。没有这些信息，服务根本开展不了。所以这种表单信息能受到用户的理解和配合，采集难度也相对较低，复核起来也容易。

在小说这个场景里，就不适合用表单收集。

因为对小说的“爱好&Rdquo;根本没啥刚需可言：

爱好是多个因素综合组成，不能直接用一两个问题问清楚

爱好不是简单1+1=2，喜欢穿越，喜欢三国，不代表喜欢“穿越去三国&Rdquo;

爱好并不是完全固定的，有可能被新题材、热门榜单、朋友推荐等引导

更不要提其他涉及个人隐私信息，难道看小说还需要被查户口？不受用户理解，即使强行采集，数据也是假的。

因此设计表单的时候，要保持克制，尽量找关键字段。对阅读而言，男女差异很大，且容易受到用户理解，因此可以在表单采集。并且男女，是个符合MECE的简单选项，不容易引起歧义。

换个角度，如果收集的是：阅读兴趣。

选项是：玄幻、历史、穿越、言情、霸道总裁、其他。

用户很容易引起歧义，比如玄幻+穿越的，算哪类？比如大女主算哪类？用户在有歧义的时候，就会乱填一通，收集回来的数据就有问题。这些细节看似琐碎，实则决定了基础属性标签的准确度。

三、关键行为标签

要定位用户当前所处的阶段，需要找能区分用户类型的最关键标签。既然目标是提升付费率，因此付费相关标签，就是第一重要的。根据用户付费记录，可以区分三个状态：从未付费/付费一本小说/付费2本及以上。引导方向也很清晰（如下图）。

4大标签，构建高质量用户画像

注意，上边分类里，有一个策略是导向：保持本篇续订。这就意味着，需要观察用户在阅读小说时候的进度。

如果付费的小说已经完结了/断更了，就得及时推荐新内容；如果用户根本连看都看不下去，或者已经愤然弃坑，那也得另寻好内容推荐。因此得再考虑用户阅读行为标签。

四、分层行为标签

用户阅读行为对付费意义很重大。理论上，只有入坑的用户才会付费，还很有可能对更多其他感兴趣内容付费。对还没入坑的要尽快拖进坑里，已经脱坑的要防止流失。因此，区分出未入坑、入坑、脱坑状态，很重要。

“入坑&Rdquo;是对读者沉迷在某本小说情节的俗称。做标签定义可不能这么随便，要有具体的指标+计算公式+业务含义，才能算一个标签。

用户如果入坑了，最起码的要求是在小说app的登录时长、登录频次有一定保证，因此可以选用比如最近一周内登录次数/登录总时长，来区分用户平台活跃的轻、中、重（如下图）。

4大标签，构建高质量用户画像

再次，如果用户入坑了一个内容，那么他肯定不会东瞄西逛，而会聚焦在一个内容里。那么这个内容占他在平台活跃时间的比例，一定相当长。

这样可以将用户是否聚焦一个内容的标签区分出来：

无感：没有一个长时间活跃的内容

专一：有一个长时间活跃内容

博爱：有多个长时间活跃内容

具体多长算长，也得用分层分析法哦。

“入坑&Rdquo;是对读者沉迷在某本小说情节的俗称。做标签定义可不能这么随便，要有具体的指标+计算公式+业务含义，才能算一个标签。

这些都有可能发生，而且会让数据分析变简单。但是在构造标签逻辑的时候，也要符合MECE方法，才能避免意外发生，这是专业数据分析人员与业务人员思考问题的本质区别：业务人员能直接抓最显眼的，数据则关注情况全面性与严谨性。

五、兴趣偏好标签

上文有提到，直接收集兴趣会有各种问题。那还能怎么办呢？当然可以从用户行为中提炼兴趣。如果一个用户入坑了某个内容，那他肯定是对这个内容感兴趣的。

这里的难点，在于区分：他到底对哪个点感兴趣。因为一个内容相关的静态标签太多了：作者、主题、风格、评论、是否热门、写法&hellIP;&hellIP;还有很多无法标准化的部分。

因此从一开始，就不能太指望兴趣标签做得特别精准，而是要结合小说的品类特点，把同款、交叉款单品选出来，找到贴近的单品即可。毕竟小说不是短视频，不需要15秒一切换。

当兴趣偏好与付费行为交叉，还会产生一种可能：有一类用户就是坚持白嫖，有很多关联阅读行为，但是就是不付钱。此时可用优惠券测试，把其中价格敏感型与真正白嫖到底的区分开，从而形成价格偏好标签。

六、输出策略

有了以上基础的标签准备，最终输出策略时就可以像搭积木一般，针对用户需求，组合出各种策略，只要基础打得牢，出结果是手到擒来的事（如下图）。

4大标签，构建高质量用户画像

七、小结

很多同学习惯了做网上的现成数据集。所谓的用户画像，大部分是现成的字段，尤其以直接收集的表单字段居多。

这种现成的数据集练手很爽，可与实际情况差距非常大。实际工作中，即使能用表单采集，也得考虑采集过程中错误、造假、复核问题。

更不用说，相当多数据标签需要通过分析计算+测试获得，需要一层层的构造，由简单到复杂。这些处理过程中技巧与手段，才是真正值钱的技能与能力，与大家共勉。

chatGPT

近期文章

互联网资讯 / 营销 · 2024年4月25日

构建高质量用户画像的4个关键标签

Need more than content? Move into the product flow.