这估计《从0到1构建数据生态系列》的最后一篇,主题是数据价值。
在之前,我们所有做的一切一切,都是基础,那么其最终的目的是什么?
当然,结果很明显,就是数据价值,那么,作为数据生态的最上层,所谓的数据价值又是以什么形式体现的呢?
BI体系
在《大数据职位画像-看看你是不是白混了贼多年!》这篇对于大数据职位分析的文章中,我们知道,大数据中很大一部分人的角色定位就是“数据分析”。
对应的职位岗位的名称也多样,“数据分析师”,“大数据分析师”,“BI数据分析”,“BI工程师”等等,五花八门。
这些岗位对应所创造的最上层数据应用价值就是,意图通过数据分析的手段,来带数据化的运营监测,数据化的决策指导,以及趋势性的预测等等。
对于前一点,即数据化的运营,这是最常规的应用手段,通过数据的反馈情况,进行运营策略的动态修正,以期获取最大化运营效果。
对于上层来说,他需要把控公司企业整体的事态走向,来制定未来的战略规划,这也是数据分析带来的好处。
通常,我们在构建起数据生态链路之后,第一需要支撑的就是BI分析体系,用于运营以及决策。
此外,结合分析以及深化一些的数学模型,我们还可以做到一些趋势性的预测,对于未来的策略做更进一步的指导,这就属于BI体系更深入的应用了。
画像体系
除了BI体系之外,画像体系是上层应用的重要核心支持,在此之上可以演变各种有效的实际业务应用。
所谓画像体系,即一方面是指针对于公司用户构建起能够全面描述用户特征的用户画像,另一方面,对于实体目标,即除了用户之外的实体,我们同样可以构建起画像,例如品牌画像,内容画像,产品画像等等。
基于这些画像,我们其实是可以做很多事的。
例如针对于电商,我们可以结合推荐系统,做更个性化的商品推荐;结合活跃时段,地域,购物特征等,进行更加个性化的推送服务,以及做个性化的EDM等;又诸如品牌画像,可以更好的为品牌进行制定推广策略;针对产品画像,剖析产品结构,优化产品内部逻辑,指导产品快速迭代等等。
画像是基石,在基石之上可以做更多可扩展性的实际应用,当然,前提是你的画像维度足够丰富,属性足够准确。
并且,需要注意的一点就是,我们在构建画像体系的时候,对于画像维度进行分层次的拆解,有助于我们填充画像属性,以及更好的实用指导。
至于说如何填充画像的属性,其实方法就很多了,部分是很明显的属性,部分是统计维度的属性,部分是需要通过机器学习以及挖掘的手段进行获取。
当然,更多的细节我们就不放在这里讨论了。
推荐系统
在网络兴起之前,用户能够接触到的信息实体(所谓信息是泛指,商品之类的也算)都是通过线下的实际展示,能够直接获取的范围有限。
在网络兴起之后,虚拟空间的概念兴起,信息实体可以放在虚拟空间中,这意味着实体(包括商品等一系列相关实体)的数量可以无限扩充。
在很早之前,用户获取信息的主要手段有两种:结构化的目录导航,搜索。
但在虚拟空间的兴起之后,随着海量实体的增长,这种以用户主动触发为主的获取实体模式弊端越来越大:筛选时间变长、可选项增大带来选择困难现象。
在时间成本越来高的现在,必然追求更加高效的实体信息获取方式,最本质的目的是:缩短用户与目标实体之间距离,减少无效信息的获取,以及提升效率。
所以,以个性化被动信息推动为模式的推荐系统则受到了欢迎。
而推荐系统,在是建立在数据的基础上,融合适应场景的各种模型算法,最终以精准信息推送为目的,提升用户的点击转化,或者其他更明确的商业目的。
推荐系统是数据得以应用的最常见的方式之一,也算是在国内应用的相对成熟的场景。
数据时代的搜索引擎
就信息检索来说,搜索引擎早就存在,而且一直存在,但早期的搜索引擎只有一个目的,那就是检索与检索词相关的信息。
这里所说的相关,纯属于信息实体属性相关。当然,这样做当然是无可厚非的,信息检索的本质本来就是检索相关的信息。
但随着数据进一步应用,以及机器学习等技术的推广,搜索引擎的模式也在悄然发生改变,只是你或许并没有过多关注而已,只是感觉搜索越来越好用了。
我们知道,中文博大精深,一句话,稍微改动一下,或者说重新组织一下,意思都可能发生巨大的变化,甚至是相同的一个词,理解的角度不同,其意义都是不相同的。
在过去,这种情景是很难处理的,而如今,随着对数据的进一步应用,以及算法模型的进一步开发,搜索意图识别已经算是“正经”搜索引擎的标配了。
除此之外,还有诸如搜索纠正,相关搜索推荐等基本的优化点,用于提升用户的体验。
最大的改变在于,过去的搜索是一个“点”,而现在的搜索结果是一个“面”。
所谓的“点”即是你所搜索直接关注的目的,也就是信息本身,而“面”则是一个多维结构,在你关注的点的同时,扩散所有的相关信息。
这就是知识图谱在搜索中的应用,产生的搜索结果是一整个相关的知识图谱结构。
实现业务的数据化、自动化、智能化
相对于上面描述的几个相对明确的数据价值应用,这里描述的就相对于偏业务层,并没有说具体涉及到某种模型,具体的算法,而是一种业务驱动模式。
我们希望通过数据,能够构建起业务驱动的自动化流程,并且这整个业务流程是可数据化观测的,然后在一些关键环节是可以智能化运作的,这样就能够提升业务的精准性。
当然,更重要的是提升商业转换价值。
期间,我们可以利用各种统计分析的手段,让业务流转是可以数据可观测的,也可以通过诸如画像属性的进一步业务化,也可以使用诸如推荐、预测等相关相对底层的技术,甚至是可以利用更复杂的神经网络深度学习等自动学习、自动优化的手段。
关键在于使用数据,再结合机器学习的手段来优化整个流程,这才是我们所需要的。
结语
最后,随着数据的价值在逐渐被挖掘,上层将会越来越多的应用模式被探索出来。
但可以预见的是,数据价值的使用,必然会从单纯的数据本身价值,逐渐延伸到更多的其他方面,而作为数据价值探索的手段,机器学习相关的技术和数据的结合也会越来越紧密。
擅长大规模数据挖掘相关技能的人,也将会越来越受到欢迎。
来源:数据虫巢,作者:blogchong
本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「我们」留言处理。