本章讲的是两个基础的分析方法,对比分析和细分分析法。这两个方法在今后的分析工作中几乎处处要用到,这也是基本的数据分析思路,所以提前到这里来讲。
一、对比分析法
对比分析法在本质上是通过数据计算方法来判定两个解决方案的优劣。一个常见的例子是:同一个电商网站上的商品A和商品B,哪一个对网站贡献更大呢?按常规的考量销量的方式显然不足以进行全面的对比,在这里我们要综合考虑访问量、转化率、商品热度才能更全面的评估两个商品对网站的贡献。
1、对比分析法的比较基准
比较基准的设定是统一对比单位的重要步骤,设定方法分别是:百分比评分均值法、标准化指标合并法。
1.1 百分比评分均值法
“百分比评分均值法”是将指标的值都转化成百分比的形式,一个通用有效的方法就是将所有指标都除以总体的最大值,这个方法对所有大于0且分布不是特别离散的指标都是很有效的。
举个例子说明
从下面的表格中知道,4种商品中访问量最高的是商品A的563 ,转化率最高的是商品B的9%。所有商品的访问量除以563,转化率除以9%,然后得到各自的百分比评分,然后将两列评分做简单平均后得到综合评分。
显然,通过比较综合评分来判断商品在表现更合理。
如果考虑的再全面些,针对不同商品的重要性设定权重,结果更能真实有效的评估商品的好坏。
比如,上面表格中采用加权平均的方法,商品的综合评分又发生了变化,如下图。至于是否加权,以及各指标的权重如何设定,则可以根据分析的需要和指标的特征来确定。
1.2 标准化指标合并法
“标准化指标合并比较法”是用标准化的方法消去各指标单位的影晌后再进行合并比较的方法。
数据的标准化是将数据按比例缩放,使之落入一个小的特定区间 。
公式为 X=(x-u)/σ 。U代表均值,σ 代表方差。
举个例子:
如下表格中数据,Bounce Rate衡量进入,转化率CR衡量产出。A、B、C三个优化方案哪个才是最优的呢?
将各指标标准化后取均值进行比较,我们可以看出A方案最优。
2、对比分析法的“实验环境”设定
进行对比分析的重要条件是两组参数需在同样的条件下对比才有意义。这时候就需要人为地去设定合理的比较环境了,即数据分析的“实验环境设定”。
实验环境设定法有两种: 基于时间序列的组内比较 、基于对照实验的组间比较。
2.1 基于时间序列的组内比较
基于时间序列的组内比较:一般是在时间序列上的某个时间点施加实验剌激,并在实验剌激的前后进行重复测试比较,从比较的结果反映实验剌激是否对结果有影响。
举个组内比较的流程例子:
公司前4个月薪资正常,在第5个月开始给员工加薪(施加实验剌激)。这时就可以通过观察之后4个月和之前4个月员工的工作效益和工作满意度,来判断这个实验刺激是否对提升员工工作效益和工作满意度有效果。
2.2 基于对照实验的组间比较
基于对照实验的组间对比:一般是在同一时间设定两组样本,(实验组和控制组),然后对实验组施加实验剌激,控制组维持原状态不变。通过对实验组和控制组比较来判断实验的剌激是否对结果有影响。
举个组间比较的流程例子:
拿前面例子来说。假如只让部分员工涨薪,再去比较未涨薪的员工和涨薪的员工前后4个月的工作效益和工作满意度的差异,如果差异显著就可以证明涨薪这个实验剌激对结果是有显著影响的。
2.3 特殊情况下,实验环境如何设定
有时候会遇到无法提供实验的对比环境,那该怎么做呢?举例说明。
如下表:有活动前和活动中各5天的数据。以订单数作为指标,说明活动能否显著提升每天的订单量。
由表中数据可发现:每天的用户数本身就是一个递增的状态,活动也带来用户数的提升。那么,订单数的提升是由于用户数的提升带来的,还是活的效果带来的呢?
1、不考虑数据本身的自然增长,直接比较活动前后日均订单数的差异;
2、将数据的自然增长考虑进去,可以将日均用户数的增长率作为整个网站数据的自然增长率。
这样,比较的结果就发生了改变。活动前的曰均订单数乘上自然增长率后要比活动中的曰均订单数高,从结果看活动对订单数的提升无显著影响。
当然,直接比较活动前后的人均订单数也可以得出结果。但是用上面乘以自然增长率的方法还可以进一步评定活动带来的效果。如果活动促进了订单数量的增长,我们可以估算出活动期间日均订单的增加量是多少,这样就可以直接考核活动的绩效。
二、细分分析法
细分分析的目的是为了看清问题真正的所在,从而找到解决办法,细分分析是指将指标与维度相互组合。
例如网站报告一般都是网站数据的综合情况,包括网站的总访问量、总停留时间、总销售量等。但是我们不知道用户在不同页面、不同内容、不同渠道的停留时间以及访问量,也就是说这些汇总数据无法对不同属性的流量进行正确的判断。所以,无论是从用户还是从网站的角度,流量细分都是很重要的。
1、指标和维度的类型
指标是用来记录访问者行为的数字,维度是用来提供观察访问者行为的一种角度,维度必须与指标在一起时才有意义。指标又可分为基本指标和复合指标,常见的基本指标有访问次数、综合浏览量等,常见的复合指标有访问深度、跳出率、平均网站停留时间、新访次占比等。常见的维度类别有访问者属性维度、时间维度、流量来源维度、地理维度、内容维度和系统维度等。
2、细分例子
例如某日,你的老板说:我想知道2015年5月9日北京地区使用Safari浏览器在Google搜索“蓝鲸”关键词并点击了自然排名结果的访问次数。
听完这个需求后,你可能感觉有点晕,好多的条件混在一起,这个数据要如何获得呢其实包含了6个维度和1个指标。
这6个维度和1个指标分别是 :
- 1)时间维度——2010年3月10日
- 2)地理维度——北京地区
- 3)浏览器维度——Safari浏览器
- 4)流量来源维度—— Google
- 5)流量属性维度——自然排名结果
- 6)关键词维度——”蓝野”
- 7)指标——访问次数
而这个分析过程也很快,5分钟就可搞定,步骤如下:
当然,如果嫌操作太复杂的话也可以通过标记用户群进行自定义细分。常见的标记用户群方法有:
1)通过用户访问特定的页面对其进行分类;
2)通过用户点击特定的链接对其进行分类;
3)通过用户的自主选择对其进行分类。
当然,细分前得分清非注册用户、新注册用户、已注册用户。
本文由 听象数据 投稿 数据分析网 发表,并经数据分析网编辑。版权归作者所有,转载此文请与作者联系。
本文由 听象数据 投稿至 数据分析网 并经编辑发表,内容观点不代表本站立场,如转载请联系原作者,本文链接:https://www.afenxi.com/39318.html 。