大嘴巴漫谈数据挖掘:差异运营聚用户,因子分析打前站

大嘴巴漫谈数据挖掘:差异运营聚用户,因子分析打前站

在产品成熟时期,产品的用户群规模和营收业绩稳定增长,提高用户忠诚,增强用户体验是这个时期的重要举措,准确及时地了解用户对产品的反馈,并以此制定针对性的改善方案,提供差异化的业务运营。

此处具体涉及用户细分和用户体验两个部分。用户细分即是将特征相似的用户归到同一个组,并对各个群进行特征刻画及分析。用户体验则是要量化现实的产品质量与用户期望之间的差距。

大嘴巴漫谈数据挖掘:差异运营聚用户,因子分析打前站

首先要对原始行为变量进行因子分析,将获取的公共因子作为细分变量,然后借助合适的聚类方法按照数据对象间的相似性进行分组归类,且使得组内对象相似程度较高,组间对象相似程度较低,有了细分群结果便可据此开展差异化的业务运营。

大嘴巴漫谈数据挖掘:差异运营聚用户,因子分析打前站

用户细分时,一般要求选取的变量对用户行为具有一定的影响,同时不能存在高度相关性,且变量的取值具有明显差异。选择用户细分的变量也不是越多越好,因为如果其中包含没有明显差异的变量,相当于放大了某些变量的实际作用,反而有可能使得用户细分结果产生偏差。

提取的样本数据包含最近登录次数、ARPU值、购买次数等变量,从经验初步判断,变量间或许存在一定的相关性,因此会首先利用因子分析产生综合变量,并将其作为后续的聚类变量。

大嘴巴漫谈数据挖掘:差异运营聚用户,因子分析打前站

因子分析是一种多变量化简技术,在尽可能损失少部分信息的情况下,利用降维的思想,将众多具有一定相关性的原始变量归纳为少数几个具有代表意义的公共因子,通常,公共因子能够高度概括原始变量中的信息。整个因子分析过程主要分为四个步骤,其中最为关键的是构造出公共因子并能够给出准确的业务含义。

大嘴巴漫谈数据挖掘:差异运营聚用户,因子分析打前站

公共因子能够解释原始变量信息的百分比称为方差贡献,正常情况下要求选取的公共因子累积方差贡献大于80%,这也是判断模型有效性的标准之一,而因子个数则是由特征值和累积贡献率共同确定。此处除了方差贡献外,还需满足特征值大于1,如果特征值小于1,说明其对应的公共因子的贡献率还不如引入一个原始变量。由此原则,如上所示,应提取前两个公共因子。

大嘴巴漫谈数据挖掘:差异运营聚用户,因子分析打前站

原始变量和公共因子之间的相关程度由因子载荷矩阵中的载荷值来反映,其绝对值在0到1之间,越接近1,说明二者的相关性也就越强。如上所示,可以看出因子1的两个变量ARPU值和在网时长的因子载荷系数均高于0.9。因此,变量ARPU值和在网时长归纳为因子1,变量登录次数、购买次数及最近间隔时长综合成因子2。

大嘴巴漫谈数据挖掘:差异运营聚用户,因子分析打前站

确定好公共因子及与原始变量间的关系后,如果还不能准确判断出其所代表的业务含义,就需进行因子旋转重新生成因子载荷矩阵。在这里,ARPU值和在网时长这两个变量在业务层面代表用户贡献或价值,因此命名为“价值贡献”因子。同理,因子2命名为“使用频度”因子。

需要注意的是,变量的选取并不仅限于以上五个变量,产品经理如果认为增加变量能够提高模型的解释程度,可以让数据分析师补充相关变量,接着再运行分析,最后从结果判断模型是否表现更好,通过不断迭代调整,直至达到最优效果。

大嘴巴漫谈,有货,有形,有味!

本文为专栏文章,来自:大嘴巴漫谈,内容观点不代表本站立场,如若转载请联系专栏作者,本文链接:https://www.afenxi.com/17360.html 。

(0)
大嘴巴漫谈的头像大嘴巴漫谈专栏
上一篇 2016-05-17 10:53
下一篇 2016-05-28 13:12

相关文章

关注我们
关注我们
分享本页
返回顶部