摘要:《大嘴巴漫谈数据挖掘》系统而全面地描述了数据挖掘的基本概念、常用算法等。《大嘴巴漫谈数据挖掘(第2季产品篇)》是《大嘴巴漫谈数据挖掘》的姊妹篇,在前作的基础上,它以产品为核心,按照产品发展的过程,依次详细分析产品策略研究期、产品概念评估期、产品研发期、产品测试期、产品导入期、产品发展期、产品成熟期、产品衰退期这8个产品发展的必经阶段所必须做的数据挖掘工作。针对产品每一阶段的不同特点,作者分享了数据挖掘的核心技能,并指出了每一阶段数据挖掘需要避免的坑。
策略研究找趋势
在产品设计阶段,第一时期策略研究首先从宏观角度对外部环境和内部情况加以分析,重点关注市场、技术等方面的发展与变化趋势,然后辅以用户细分研究,以此从中明确产品未来开发的相关策略。
借助企业内部和外部资料的收集处理,趋势分析能够帮助产品经理及时准确地了解行业发展趋势,为进一步的分析调研提供重要的参考依据。研究结果一般包括用户日常生活、社会经济发展、技术产业变革以及宏观竞争态势等方面。
目标用户要细分
策略研究时期的用户细分主要根据用户的生活方式、消费习惯以及价值观念等特征,把用户归类分组,使得不同细分用户群之间的需求差别比较明显,同一个细分用户群的需求倾向基本一致。通过用户细分,可以避免提供与用户需求不相匹配的产品,从而有效提升产品获得成功的可能性。
用户细分通常根据选定的分析维度来了解并描述目标用户的典型特征,一般会通过定性和定量两个步骤来完成。定性研究采用焦点小组的方法,定量分析借助街头面访的形式。
定性研究划小组
在定性研究中,焦点小组是主要方法之一,广泛用于用户需求调研、产品功能挖掘等方面,主要针对于用户对某产品的认知及评价使用过程中所存在问题。其优点在于常常能够从自由讨论的小组座谈当中,获得有价值的信息。通过与访谈对象的互动交流,辅以经验丰富的主持人,总结归纳并最终形成相关理论。
焦点小组是一项组织细致的工作,需要考虑诸多对研究结果可能产生影响的因素,如样本用户选取、主持技巧把握等。
焦点小组通常会在一个专业测试室内进行,为了便于现场观察和全程记录,一般会装有单面镜及录音录像等相关设备。
在实施过程中,首先筛选预约被访用户,确定主持人,甄别目标用户是流程中关键的一个环节,其质量的高低直接影响到筛选出的用户是否达到访谈的要求,然后设计详细的访谈提纲,布置座谈会环境,准备相关杂项,如饮料食品等。座谈结束后,整理资料分析,并形成最终的结果报告。焦点小组的研究结果可以作为后续定量分析问卷设计的基础。
样本条件配用户
甄选样本时,样本条件需要考虑用户基本属性,如职业、年龄和性别这三个维度,用户配额条件为男性5名,女性5名;25岁以下5名,25岁以上5名;学生5名,在职5名。实际研究工作中,则需要根据具体情况划分类别和确定样本数量。值得注意的是,在被访用户参与人数较少的情况下,配额条件通常不考虑交叉配额,即一个被访用户需同时满足几个配额条件。另外, 被访用户个人特征、经历背景尽量做到差异较小,不要出现诸如男性9名,女性1名的情况。
座谈讨论辨特征
小组座谈中,通常会涵盖用户的使用行为、价值观念、功能需求等方面的信息。访谈提纲根据产品实际情况包括但不限于如下所示的几部分:
◎ 生活轨迹部分包括用户日常的生活及业余爱好;
◎ 消费习惯部分包括指定产品的用户订购情况、购买动机;
◎ 需求偏好部分包括用户的产品态度、认知渠道等。
◎ 情感认知部分包括用户的情感倾向认知特点;
◎ 价值观念部分包括日常生活工作中经常谈论的话题以及对未来的期望;
◎ 使用行为部分包括对用户功能需求的描述和特定产品业务的使用方式等;
◎ 需要强调的是,主持人应按照以上访谈提纲次序逐一展开讨论,并在现场适时引导, 防止讨论偏离主题。
研究用户挖供需
收集到定性问卷的结果数据后,需要从用户属性、业务偏好等维度进行综合研究,归纳出不同背景下的用户需求特性,为后续定量分析提供依据。
如上所示,针对分析结果可以列出一张表格进行直观总结,按照用户特征、生活轨迹、消费习惯和需求偏好四个维度,将目标用户分为严谨务实、自由享乐和恋家关爱三种类型。其中严谨务实的用户偏男性、收入较高,以管理人员居多;自由享乐的用户生活较为随意,业余生活丰富;恋家关爱的用户一般要求产品功能完善、便捷省心。
街头面访寻偏好
随后的定量分析以定性研究为基础,基于一定数量样本,对用户的行为和态度进行分析挖掘,细分出不同特征的用户群体,并加以描述。此处采用了街头面访的分析方法,即在一个相对固定、安静适宜的场所环境内,开展一个较长时间的访问。
接下来先要进行样本筛选及确定问卷结构。样本筛选主要是确定样本量和抽样方法,问卷结构则包括需要调研的各个方面,如生活轨迹、需求偏好等。
在样本筛选时,样本量的多少直接影响到抽样误差的大小,一般来说,抽样误差会随着样本量的增大而减小,但下降幅度会逐步减小,抽样成本会逐步增大。达到一定规模后,即使大幅增加样本量,抽样误差也不会明显降低。如上所示,在置信度等于95%的情况下,不同样本量对应的最大抽样误差。
因此,为了降低抽样误差,尽可能选择较大的样本量。即便在预算经费有限的情况下,至少也要保证30个最低统计样本,低于30个样本就不具备统计分析意义了。
除了总样本量外,样本筛选还要确定配额指标和分配份额。配额指标一般与样本条件中规定的用户特征一致,如年龄、性别、收入等。若将性别作为配额指标,则类别为男和女,最后根据每类指标所分配的份额选取样本,并进一步规定其中的样本人数。比如,按照性别选取样本,男性300人,女性300人。
有时,当参与人数较少时,配额条件不能太严格。为了确保找到合适的被访者,一般不考虑交叉配额,即被访者需同时满足多个配额条件。
根据前面定性研究的结果,从中挑选总结出一部分关键语句,以此形成具体的测量问题。定量问卷生成后建议进行两到三次试访,并结合访问情况调整问卷,以及安排好整个面访时间。
问卷开头记录被访用户、访问人员的信息以及面访的开始时间和结束时间。其中设置甄别题目是为了去除有可能影响调研结果准确性的用户。值得注意的是,问卷内容并不仅限于下面示例中的部分,可以根据产品的实际情况补充调整。
定量问卷的第一部分主要涉及产品的使用情况。如下所示:
◎ 需要了解一些经常使用的产品应用,并按熟悉程度打分;
◎ 最近一段时期使用某一指定产品的业务应用场景,通过什么方式接触到产品,产品实现了哪些功能,使用频度以及更换频次又是怎样的。除此之外,一般还会要求被访用户回答能够想象到的,在工作和生活中所需要的,而目前还没有提供的产品等。
定量问卷的第二部分主要涉及业务需求偏好。如下所示:
◎ 经常使用的产品类型及品牌是什么,订购时的价格是多少,使用的年限有多久了;
◎ 产品的功能有哪些,其中最看重的功能是什么,功能的使用频率又是怎样的;
◎ 如果要更换产品,主要是因为哪些功能没有满足,还是其他的什么原因。
定量问卷的第三部分主要涉及用户生活方式。如下所示:
◎ 根据被访用户自身的感受,采用5级量表,衡量一些关于生活态度、产品技术相关的问题,其中选项5表示完全同意得5分,选项1表示完全不同意得1分。比如会询问诸如“是否比较喜欢锻炼身体”,“家庭生活比事业更重要”,“节假日都会参加些娱乐活动”等问题。
随后会用到因子分析和聚类分析两种方法。首先将调研问卷中的一个或几个问题语句看成一个原始变量,然后根据原始变量之间的关系提炼出公共因子,如可以将“通常注意生活和饮食习惯”和“比较喜欢锻炼身体”提炼成一个“生活因子”。如上所示,还提炼出了“社交因子”、“时尚因子”、“职业因子”和“娱乐因子”。在这里,提炼因子的目的在于提高后续聚类分析的有效性。
根据问卷结果,获得样本用户的各个因子得分,主要反映了用户在此方面的偏好程度,得分越高说明关联性也就越强。接着再使用变量聚类,根据因子得分的高低将用户划分为不同类型的细分群体。
如上所示,张三的生活、社交及职业因子得分最高,归纳为事业型。李四的娱乐和时尚因子得分最高,总结为享乐型。由于公共因子之间不存在相关影响,用户细分效果明显。
最后,产品经理可以通过图形来了解各个细分群体的目标用户群特征及规模比例。如上所示,饼图中①表示享乐型的细分群体,规模最大,占总用户比例的70%;②表示事业型的细分群体,用户占比为30%。
总的来说,产品策略研究时期主要涉及宏观环境,包括用户、社会、技术、商业趋势以及了解人们日常行为中的习惯偏好等,以此促进产品概念生成。
——本文节选自《大嘴巴漫谈数据挖掘(第2季产品篇)》,博文视点投稿
本文为专栏文章,来自:大嘴巴漫谈,内容观点不代表本站立场,如若转载请联系专栏作者,本文链接:https://www.afenxi.com/14264.html 。