互联网技术 / 互联网资讯 · 2023年11月20日 0

多个影响因素下的数据分析:如何进行归因?

数据分析领域有几个经典的终极难题。多影响因素归因,绝对是其中最让人头大的。特别是临近年底,品牌、售后、客服、供应链、运营、产品、商品管理都会跑来,问:今年业绩不错呀,那么问题便来了:今年公司多赚的10个亿,到底几个亿归功于品牌,到底几个亿归功于供应…那么,到底该怎么分析呢?今天我们详细讲解一下。

1.多影响因素归因的表面 为啥这个问题是终极难题,只要做一个实验,马上便知道。同学们可以亲自试试哦。第一步:请闭上眼睛。第二步:回忆淘宝里最近买的一件商品。第三步:在脑海里回忆该商品的名称、包装、价格、品牌、客服小妹声音…第四步:睁开眼,告诉自己:我为这个商品付费的XXX钱,其中有X%是付给名称,X%付给包装,X%付费给商品上blingbling的广告,X%付给快递叔叔…答得出来不?不但很难答出来,估计很多同学连最近买的是啥都不记得了。消费者不是所有消费都理性。消费者不是所有商品都重视。商家提供的品牌、服务、产品本身就是一个整体。因此站在消费者角度,这个问题从源头上就不成立。特别是啤酒瓜子矿泉水一类的快消类产品。价格低,消费频次高,冲动消费多,心情好了就买点,心情不好了也买点,因此很难讲清楚。大宗耐用品,比如房子、车子可能思考的多一些,有一定概率区分出来,但是仍然很难量化到每个因素的得分…

那么问题来了:为啥明知道分不清楚,各个部门还一而再、再而三要求分家呢?这就触及到问题的本质:大家的屁股坐在哪里。

2.多影响因素归因的本质 表象上看,多影响因素归因,难在很难拆解数据。本质上看,多影响因素归因,只是部门间分赃不均的结果。每个部门都太急于证明自己的价值,总想努力跟业绩指标挂上联系。特别在年底,要为部门争取奖金,要为明年争取预算,分家的冲动就更高。因此,多影响因素归因,本质上是在衡量部门价值,这才是核心难点。很多同学会忽视这个核心问题,用一些简单的数据方法处理。比如:把各个部门的费用设为x,把业绩设为y然后怼一个线性回归模型出来。然后把各个参数的系数视为贡献大小。且不说,这么干,首先完全误会了回归模型的含义;其次,也没有考虑分类变量和连续变量的问题。单纯就结果本身,也会被人喷死…

比如,算出来销售的系数是2,供应链的系数是1,那明年多找2倍的销售,却只提供1倍的商品,还能有这个销售业绩吗?肯定不可能啊,有枪没子弹啊!部门之间分工合作,不是简单的1+1=2的关系,这是常识。因此强行割裂部门间联系,把不同分类的部门拉在一起评价,是注定要扑街的。因此,破局思路,在于从一开始,就应该直接否掉这种一条公式打天下的想法。从部门工作性质出发,建立科学的衡量机制,从而有效化解这种立功焦虑。

3.破局思路 想破局,首先得分清各个部门的工作类型与贡献方式。之后,就可以分门别类进行分析考察。软支持类:放弃直接关联销售业绩,按需分配。硬支持类:考核。硬拉动类:引入ABtest机制,提前预设目标。核心流程:建立分级机制,深入分析影响。

4.现实永远很骨感 以上只是理想状态下的建议,实际开工。总有人想争取更多资源,大喊:“品效合一!&Rdquo;“心智资源!&Rdquo; 总有人认为客服售后没必要,今年再扣他点费用?(从而引发服务部门的奋起反击“老子也有贡献!&Rdquo;) 总有人喜欢夸大自己贡献,促销活动效益写的巨高,甚至比自然销量还高。 总有人怕被追究责任,拼命往:没有促销!没有支持!产品不给力上推责任。所以有关“到底每个部门贡献多少,能不能具体到每一块钱里几毛几分是谁来的&Rdquo;的议题,永远不会停下来。加之,总有新入行的数据分析师,认为只要怼几个数据进线性回归或者因子分析模型,就能算个参数出来让每个部门满意。所以这种来来回回扯皮的事,还会延续很多很多年,哈哈哈。

5.小结 类似的数据分析千古难题,还有很多。每一个问题,都是表面看似数据分析,背后是人心贪婪,推过拦功。业绩好了就说是自己做的,业绩不好就甩给外部各自因素,内部各种无法量化的因素,以图自保。实在不行就说是数据分析能力不行,你咋不早点预测出来呢!做数据分析的同学们,要对这些问题有足够清晰的认知,不要轻易上当哦。就比如看似最简单的:自然增长率怎么算,到底咋算才能让业务部门服气呢?