摘要:据Dresner咨询服务公司的一项新调查显示,几乎没人能说清大数据到底是什么鬼;而且参与调查的所有公司,也几乎都没用大数据做真正有意义的事儿。是不是觉得很吃惊
许多公司已经在积极使用大数据,只是它们没有称之为大数据罢了。虽然“大数据”一词有诸多争议,可是这项技术还是变得对公司业务来说必不可少。
据Dresner咨询服务公司的一项新调查显示,几乎没人能说清大数据到底是什么鬼;而且参与调查的所有公司,也几乎都没用大数据做真正有意义的事儿。
是不是觉得很吃惊
其实也没什么好吃惊的。就算是许多年前就有人预言大数据的出现,可归根结底,大多数公司还是把全部的精力,投入到如何将小数据充分利用起来。
这倒不是说大数据没那么重要。谁也不能否认,企业如今从数据中收获颇多。因为事实就是这样。但是,想从大数据中获得价值,企业首先要变得务实。
谁需要大数据
正如Datamation杂志的詹姆斯·马奎尔(James Maguire)所写,Dresner咨询服务公司并没有看到大数据获得大规模部署的现象。
只有17%的公司承认正在使用大数据,另有47%表示计划未来使用,但何时使用还不确定。如此看来,难怪报告最后得出的结论是:“尽管经过了长期的造势和炒作,眼下大数据分析技术的实际部署,仍然无法广泛适用于大多数企业组织。”
大数据,就是一大堆没有的东西吗?
答案当然是否定的。毕竟,在报告调查的对象中,有59%的观点表明,大数据“至关重要”,尽管他们现在并没有明显地感觉到,有用什么大数据处理的任务。那么这里,显然这里有某个因素在作祟……
我坚定地认为,一定存在“某个东西”。
你不断使用那个词……
早在2012年,NewVantage Partners就颠覆了公众对于大数据中“大”的定义。尽管在Hadoop及其生态系统的厂商的幕后推手下,媒体大肆报道PB级数据问题,但事实上大多数公司根本不存在所谓的PB级数据问题。
正如这项调查所发现的那样,企业面临的主要问题,还是数据的种类和处理速度。
市场终于心领神会,开始将越来越多的资金投入到可以更轻松地管理不同类型数据的技术上(比如MongoDB等NoSQL数据库和DataStax版本的Cassandra),以及处理流数据的技术上(比如Apache Spark)。
与此同时,企业继续求助于更传统的数据基础设施,比如甲骨文。就像DB-Engines在2015年年底盘点中发现的那样,甲骨文在去年最受欢迎的厂商评比中,涨幅最大(综合衡量发布岗位、技术论坛提及率和谷歌搜索等方面)。
它甚至超过风头正劲的NoSQL,超过云优先的亚马逊,超过其他任何厂商或技术。
当然,甲骨文这种人气的上扬,某种角度讲与大数据关系不大,而是缘于管理整齐的行列数据。但是从NewVantage Partners的调查数据来看,这种比较“小”的数据才恰恰是大多数大数据分析技术的处理对象。
另外,抛开结构化数据,我想也许许多公司还是不认为多样化、高速度的数据,就是“大数据”。这可能是很少有公司声称自己在对大量任务进行处理时,实际已经使用大数据技术的一个原因。正如MySQL数据库工程师贾斯汀·斯旺哈特(Justin Swanhart)所说:“大数据毫无意义。你还不如问别人他们想要哪种数据库。”
总而言之,就算大数据如此活跃地出现在人们的视野中,但许多公司未必认为它就是“大数据”。
那又如何
对于正在想自己是不是被大数据甩在后头的企业来说,别再瞎担心了。正如Gartner的分析师尼克·霍德克(Nick Heudecker)所说,“大数据”已迁移到大家更熟悉的领域中:
- 先进分析和数据科学
- 商业智能和分析
- 企业信息管理
- 内存中计算技术
- 信息基础设施
很多企业已经在充分利用大数据做项目,只是不把它们称之为大数据。即便如此,有大量工作还是没有做到位。正如麻省理工学院斯隆学院数字商业中心的研究员迈克尔·施拉格(Michael Schrage)所说:
“预测分析产生的最深远的影响,并不来自大幅改进预测质量,而是使企业从根本上转变考虑问题和机遇的角度。”
换句话说,许多公司可能并不缺少将大数据充分利用起来的必要技术;它们缺少的,是寻找彻底将数据充分利用起来的那种方式的渴望。分析员们解读数据是一回事,而真正利用分析结果扒动公司业务的实时变化,则是另外一回事。
这不是你从某家厂商所能买到的那种东西。它一定需要在企业的DNA内部发生变化。既要更准确地了解大数据,又要用大数据切实处理一些任务,企业确实面临艰巨的任务。
原文标题:Big data’s big problem Most companies don’t realize they’re already using it
本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「我们」留言处理。