由于大数据软件快速发布,加之所管理数据数量巨大,大数据市场已经到了出现安全问题的时候。爆发只是时间问题。
事实上就像Gartner 调查去年披露的那样,很少有公司认真对待像Hadoop那样的既必需又基础的架构中存在的安全问题。那时仅仅只有2%的调查对象认为Hadoop的安全问题很重要。这种情况让Gartner的分析师Merv Adrian疾呼:“几乎没人回应安全问题,真是太吃惊了!”
CIO们或许想要闭上双眼祈祷大数据的安全性,但这种祈祷是徒劳的,除非能优先考虑安全问题。
我担心什么?
尽管大数据之“大”导致了“原始数据不能被持续监测和追踪”,多年来企业多多少少在像Hadoop这样的大数据基础架构中设置了安全路径。在2014年初, Adrian提醒了对数据安全性兴趣的缺乏,他质疑道:人们会相信Hadoop是安全的吗?因为显然是不安全的。每一个栈布局都存在弱点,数据层级本身也有很大的问题。
一年之后,Adrian的同事Nick Heudecker惋惜道:在信息管理小组组织的Hadoop调查中,谈到安全问题的不到5%。这种情况在2015年必须改变。
但这种情况并没有得到很大改善。例如,Ray Burgemeestre(一个安全工程师)说越来越多的人在问“给Hadoop/Spark安装了所有安全设施以后,我怎么能知道族群是安全的呢?”而答案是“不能十分满意”。也就是说“为了提高Hadoop安全性,还有很多工作需要做”另一名对Hadoop安全问题感兴趣的参与者-荷兰银行研究与开发主管Bolke de Bruin指出,虽然Hadoop社区越来越意识到需要保护Hadoop簇中数据的保密性,但是对数据完整性的注意关注仍然十分有限(维护和保证数据在整个生命周期中的准确性和完整性)。他继续指出:由于比较复杂或者故意忽略,甚至连Hadoop原有的安全设施都往往不安装。之所以故意忽略是因为像Apache Range这样专注安全的东西虽然有用,但用处并不大。
作为大数据基础框架之父,在过去几年里Hadoop备受关注。即使有无数敏感数据涌入其集群,如果没有足够的安全保障,我们就会遭遇重大的安全问题。
谁有时间?
问题是时间,或者说缺乏时间。就像Mobilelron在最近的一个移动端安全报告中强调的那样“任何软件,在市场上的时间越长,越有可能暴露弱点”。这种情况对开源软件来说就尤为明显,因为弱点被发现之后或者之前开源软件都提供了挖掘源代码的能力。
然而,大数据基础架构市场并不会长久保持不变直至缺点曝光。事实上,作者们在一个2015年12月的Gartner report中建议购买公司:“不要用一年前的分析和试验来评估Hadoop,因为已有的版本在迅速完善,而新的版本也在迅速开发出来”
“迅速”二字听起来是很不错(创新万岁),但其实安全问题也是同样的迅速发展。就如Adrian提醒的那样 :“随着Hadoop成为主流,关键问题将显现出来。”而且不仅仅是Hadoop会出现问题,因为公司主要依靠的是Hadoop, Spark, Kafka以及一台独特的快速运转的主机。就像Zeynep补充的那样:我们犹如是极不安全的代码区建造平民窟似的高楼大厦。
我们已看到为了应对这个问题如Cloudera和Hortonworks这样的Hadoop供应商已经致力于让自己在安全问题上独有建树。我猜这个企业级的安全问题会花费巨大的金钱,但这是值得的。
英文链接:http://www.infoworld.com/article/3104048/analytics/big-data-security-is-a-big-mess.html
数据分析网翻译小组翻译,翻译成员——Lena。
本文由 翻译小组 翻译发布,英文链接:,转载或内容合作请联系我们,未经允许谢绝转载,本文链接:https://www.afenxi.com/39335.html 。