数据新闻走向何方?“故事为核,跨界合作”

我们如今生活在一个“大数据时代”,全世界的政府、企业、甚至个人每天都在制造海量数据。“数据新闻”应运而生,越来越多的记者开始投身到这片新闻蓝海中,挖掘藏在数据中的“新闻价值”

当下数据新闻的趋势如何数据新闻的未来又是什么样子呢在第二届亚洲深度报道大会上,深度君邀请到了英国《卫报》的数据项目编辑 Helena Bengtsson,伊利诺伊大学奈特企业与调查报道项目教授 Brant Houston,以及前路透社香港分社数据新闻编辑 Irene Liu。三位资深数据记者坐而论道,畅谈数据新闻的过去和未来。

数据新闻将去向何方

Irene Liu:未来,数据新闻会延伸到各个生活的方方面面,我认为这也正是它令人兴奋的地方。数据新闻近年来的发展蒸蒸日上,我看到很多新工具不断涌现。这些工具能令记者们的工作更加便利,帮助他们发掘以前接触不到的数据资源。不仅如此,当下“数据”的概念也发生了巨大变化。我们曾经认为只有电子表单上那些数值型信息,才可以被称为“数据”;但是现在,“数据”可以是网络上任何非结构化的信息。

但是不论工具如何发展,数据的概念如何变化,我认为数据新闻的核心是不变的——用数据讲故事,和对权力问责。只要秉承这个初心,那么只有天空才是我们的极限了。

Brant Houston:我觉得数据新闻的未来可能会走向更高级的算法领域。诸如聚类(clustering)、主题模型(topic modeling)等高级算法,已经被应用到自然语言处理(NLP)技术中了。面对庞大的文本数据集,这些高级算法可以帮我们发现其中的主题或特征。

为了从海量数据中发掘出想要的信息,数据记者们也需要借助一些平台或工具,比如利用网络社交媒体的信息进行数据新闻报道,这是我们已经在做的事情。今后我们将会面对更多非结构化的数据,数据新闻要做的就是把它们变成结构清晰的内容,发现其中的价值。

Helena Bengtsson:数据新闻如今正在向两个方向前进。第一个方向是跨领域合作。当我刚开始做数据新闻的时候,所有的工作都由记者一个人来完成;而现在,记者可以和工程师、设计师一起合作完成项目,事半功倍。

从故事的方面来说,我希望数据新闻的第二个方向是,能处理更大、更加非结构化的数据集。目前我们尚未有能力处理大批量文本内容,但这是我们努力的方向。今年,一份有关国际投资的跨境调查以其涉及数据之庞大震动世界。某种程度上,我希望我们十年后才拿到这样一份数据,因为到那时,技术的发展应能让我们做出更多有价值的新闻故事。

数据记者面临最大的挑战是什么

Bengtsson:我觉得是不被理解。现在仍然有很多人不清楚我们在做什么,也不知道我们为什么要做这些东西。我从1997年开始从事数据新闻,我工作的一部分内容就是向我的同事们普及数据新闻的概念。即使在《卫报》,我也一直在做这件事。向同行启蒙和普及数据新闻是我的主要工作,我会告诉他们,数据新闻都在做什么,以及数据新闻的价值和意义。

Liu:我认为可能是对数据的认知。现在有很多人认为,数据是客观的,而人和机构都是有偏见的。但事实上,数据也是由人和机构创造的。所以我们对待数据要始终保持质疑的精神。与此同时,数据记者也要意识到,自己的假设、先入为主的观念以及不自知的偏见也会影响他们处理这些数据资源。所以不论我们的对象是谁,个人也好,数据也罢,记者们都要时刻保持警惕,保证故事的可靠性。

Houston:当我刚进入这个领域的时候,数据新闻是很简单的。你只需要掌握一些数据库管理软件,几个数据清理的工具,再加上一点基本数学知识就可以了。但是现在,这个行业对数据记者的要求提高了。如果想要拿到一些数据,你可能必须要从网页上进行爬取数据,然后你还需要做数据清理、结构化等工作。

对数据记者来说,另一个重大的挑战来自政府官员。有时候,政府并不会向记者提供他们需要的数据。数据新闻归根结底就是信息的争夺,记者如何与政府官员斗智斗勇已经是一个老生常谈的话题。作为一个记者,比起从前的文件档案,我更喜欢现在的电子数据。因为电子数据就像水流一样,很难被完全封闭起来——总会发生“泄漏”。

当下的数据新闻中

最令人激动的事情是什么

Liu:数据新闻的跨地域、跨组织交流合作一定是最令人激动的事情之一,这也是数据新闻之后的发展方向。我们生活在一个全球化的世界,大家在创作数据新闻时遇到的困难,已经超出了媒体和国家的界限。当下,资源越来越紧缺,而我们对新闻价值也有着越来越高的追求。想要生产出具有影响力的数据新闻,唯一的方法就是通力合作。数据记者们必须携起手来,共同应对挑战。

Houston:我已经在数据新闻领域工作了整整30年了。对我来说,现在看到有这么多人从事相关工作,有这么多关于数据新闻的职业培训,而且数据新闻甚至走进了大学课堂,这本身就是一件很令人激动的事。

数据新闻对我来说,核心永远是故事。如今的数据记者不仅擅长传统分析,还懂得使用合适的呈现方式,让新闻故事更具可读性。从一开始的不被人理解,到现在涌现出这么多优秀的数据作品,回首数据新闻的发展历程,一路走来令人感慨万千。

Bengtsson:最令我兴奋的应该是自然语言处理技术,以及在大规模非结构化文本数据领域的技术进展吧。很多语言学家也加入到了技术的开发工作中,目前已有能处理自然语言的脚本文件,但这仍是起步阶段。

机器学习(Machine Learning)是另一个令人兴奋的领域。机器学习,简单来说就是先用少量的文本信息“教”计算机如何处理数据,然后再让它按照之前学习的模式,批量地处理大规模的文本信息,最终得出一个有效的结果。虽然至今我还没有发现有哪些新闻作品成功地运用了这项技术,但我相信这是一个很有趣的领域,值得人们继续关注。

你最喜欢的工具是什么

Houston:我喜欢数据库管理软件,或许是因为我一入门就用那个。

Liu:到目前为止还是Excel。

Bengtsson:我最喜欢的工具还是Excel,它也是我使用最多的工具。

作者:Adiel Kalpan

编译/程一祥

编辑/Ivan Zhai,梁思然

来源:全球深度报道网

本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「我们」留言处理。

(0)
大数据精选的头像大数据精选编辑
上一篇 2016-10-15 10:35
下一篇 2016-10-16 21:49

相关文章

关注我们
关注我们
分享本页
返回顶部