BI,Business intelligence,中文大都称为“商业智能”,我所理解的BI,是服务于产品或企业管理者,以决策支持为目的,对现有数据进行有效整合,并形成可视化报表作为决策依据的完整解决方案。
解读如下:
受众及目标
面向的是管理者,管理者的最主要工作是决策,决策有两个方面,一是对明确目标的做与不做,二是借助一定工具(BI就是这么一个工具)和方法分析现有信息,决定采用何种方法和步骤来实现目标。由此可以看到,管理者需要做某些方向的决策,BI就提供出与这些决策相关的数据提供参考。
受众和目标决定了BI作为完整解决方案的边界和架构,即是依据业务决策项不同而变化的数据支持服务,决策不被BI驱动或替代,通俗说,有什么决策就要什么样的数据,而不是有什么数据去做什么样的决策。
现有数据收集
产品或服务产生的数据繁杂多样,万变不离其宗,能支持决策的一定是终端用户产生的与业务目标相关的数据,可以近似看成用户的消费(不限于实际的购买行为,也包括虚拟物品如音乐、游戏等消费,甚至包括某个工具属性功能的使用也可以视为消费)数据、行为数据和消费品数据。
通常这些数据被储存在CRM、CMS及日志中,包括不限于以下:
- 用户消费记录,尤其要关注用户在时间上前后相继的上下游消费
- 搜索、收藏、分享等UGC
- 用户的网络特征及设备特征
- 用户的人口学信息(实际应用中由于准确度的问题,意义不大)
- 用户浏览操作行为,内容型产品尤其重要
- 用户间互动及关系链数据
还有一些信息在管理者所处系统的外部,如竞品信息和行业信息,需要额外收集和分析
竞品监控
- 通过招聘职位和招聘人数确定对手发展方向
- 通过专利申请数确定对手优势
- 通过百度指数和关键词流量估算对手数量级
- 通过社交网络或是问答网站的内部人员言论研究对手
行业监控
- 通过关键词订阅关注行业政策变化
- 通过权威机构发布的报告研究用户及客户在行业中的位置变化,预测下一步行动
对数据的有效整合
有效整合数据如同淘金,可分为三个阶段:
数据降噪
能收集到的数据很多,需要去除杂质,否则数据过大会影响到分析效率,甚至导致出现方向性错误。一般可经过这样几步来完成这个过程。
1.定义有效数据
- 有效数据与产品或服务的目标高度一致,与终端用户的需求一致
- 是准确且可重复获取的
- 能覆盖用户群的大多数,在必要时才只覆盖活跃用户
- 有效数据的获取的性价比高,可操作性强
2.简化参数和逻辑
- 存在高度相关的参数时,保留其中一个
- 存在相关度低,但证明同一结果的参数时,保留其中一个
- 因果关系的推理过程是简单直接的
3.量化有效数据
过滤出有效数据后,还需要对不同的有效数据进行量化归一,举例说明,确定用户对某个电影的喜爱程度,用户将这个电影分享给很多好友的行为比仅仅观看该电影这个行为要高得多,量化(标准可以灵活,但是要明确且唯一)来标记这些行为,为后续的机器计算铺路。
数据结构化
把数据结构化,实际上是为了给BI创建决策模型做准备,这些数据可以准确描述参与到产品和服务中的各关键角色,如用户和消费品
- 以用户为中心组织数据,划分为不相互依赖的维度,通常是用户特征和特定行为
- 以被消费产品为中心组织数据,通常是不同维度的tag
数据分析的方法和工具非常多,包括不限于以下:
- 通过图模型、贝叶斯等完成用户偏好分析或用户分类
- 通过统计工具确定用户质量分布和各操作节点的转化率
- 通过回归预测趋势
决策依据
从决策过程来看,无论是组织决策还是个人决策,都有以下过程(BI输出的数据需要与决策匹配,因此输出项就产生在决策过程中):
- 发现终端用户问题并形成决策目标。重点是定义问题和定义最终目标(多以消费为最终目的)
- 描述每个方案的可能性。重点是定义影响决策的变量参数(BI的输出项)以及方案中要素的重要程度(BI输出项的权重)
- 定量评估方案。虽然是理性判断的基础,但量化本身又依赖于以往的知识结构,有感性部分。
- 综合决策。决策需要综合各种学科的知识能力,BI通过自动化输出决策关键信息来简化决策前期消耗的时间。
准确报表
报表是BI的最常见输出物,现代BI不局限于此,利用了大量数据可视化的成果,帮助理解数据,同时加入了异常监控、重要事件节点记录、方案资源管理等等功能,形成了完善的系统。
本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「我们」留言处理。