9月12日,在由中国传媒大学国际传媒教育学院、财新数据可视化实验室、百度新闻实验室联合主办的“京华论道——2015可视化与数据新闻分享会”上,中国传媒大学教授、大数据挖掘与社会计算实验室主任沈浩分享了他对当下技术与数据新闻关系的理念。他强调了数据可视化技术在数据新闻叙事和新闻理念当中角色的转变——在原有新闻理念的基础上,可视化技术拓展了新闻呈现方式,也成为传统新闻人才和数据新闻人才的巨大差异。沈浩认为他正在培养的是“懂新闻的数据艺术工匠”。
以下为演讲实录:
非常高兴站在学校的大讲台,我今天演讲的题目:数据新闻和可视化工具,可视化工具包。
前段时间有两个非常流行的书,一个叫《爆发》,一个叫《大数据时代》。当时我给这两本书写了推荐语,我说:这是令人兴奋的时代,也是大数据的时代,数据科学让我们越来越多的从数据中观察到人类社会的复杂行为模式。《爆发》这本书的核心观点是说人类行为的93%是可预知的。《大数据时代》这本书的核心观点是大数据是工作、生活和思维方式的改变。
这是一张非常著名的图,是在facebook实习的学生,当时用R语言可视化语言描述了facebook、扎克伯格如何掌控地球,让我们从可视化的感知上看到整个社交活动,社会网络。在沟通的过程中如何去洞察数据。
我们知道人是一种视觉动物,利用视觉去感知世界。特别是像这样一张图描述了每时每刻全球发布twitter的数量,你会发现这是一个数据实时在线的呈现。
在这张图中看到那一片黑,就说明中国人不太用twitter,我们立刻感知到了这样的情况。有一种说法,除了上帝,所有人都应该用数据说话。怎么说话呢?显然可视化很重要, 因为只有看得见我们才做得好,看得见才能做得到。
可视化:形式会大于内容
比方用一个简单的图示我们就能知道,卡布其诺是什么,拿铁是什么。这种直觉使得我们看到今天对于可视化来讲不仅有数据可视化,有信息可视化,还包括信息图,交互可视化,这个范畴涉及到很多跨学科领域,这个跨学科我们的定位是什么?
今天,人们都是打开自己的手机,我可以自己去调整频道,我想看看新闻联播,看看非诚勿扰,或者去找找甄嬛传是怎么样,天气预报怎么样,从网上把数据调出来,这时候可以看到除了这个以外,我们可以感知到所看到的可视化的感觉。 我经常有一句话说,形式会大于内容,我有后面这句话,在有内容的前提下。
可视化,我们叫数据可视化,有各种可视化——地理可视化,城市可视化,也有新闻可视化。无论你做的再好,这个可视化犯了一个很严重的错误,犯了非常大的错误。你看到了吗?因为我这张图把台湾丢了,南海找不到了,可视化做的再好,这张图犯了政治错误,做新闻的人首先要明白这一点。
一张图,尽管描述的是相同的信息比如中国的军队有230万,跟中国的人口的相关性,比如千人,或者万人应有的人数,可能我们就排到了最犄角的地方。但同样,我们的国防开支占的比例跟GDP比也一个道理。比如:军费开支,如果绝对量肯定美国第一,但占GDP的比例美国就不一定第一。 如何使用可视化,核心是我们对数据的理解,以及跟数据相关的分析结论。我们要从可视化的视角,用数据模式改变你的心理模式。
可视化有很多方法,之前有很多的可视化都是我用excel做出来的。这样的工具有一个问题——没法上网,没法在手机上演示。所以过去可视化非常容易展现——如果我投入怎么样,就会怎么样,非常直观。早期的可视化主要在商业上。回答如果怎样就怎样,像这样的可视化非常容易让我们感知,包括我们对收视率的认知,包括像机场大屏上会直接显示航班动态,以及对航班整个的预警。
从这个角度来讲,可视这些都是在PPT上,在excel表格上就可以实现的。现在是大数据时代,数据和新闻的融合是趋势,数据新闻是从数据中发现事实的报道。这个核心是可视化,大数据时代,和新闻的融合。我们做一个个性化的词云,做一个文本的主题分析,你会发现excel没有这些功能,或者当时没有这个功能。语义到底怎么解决?微博上人们的传播路径是什么谁是意见领袖谁是谣言的传播中心点呢?当数据量大的时候怎么感知这个点
比如当时很重要的杜蕾斯的传播路径图可以解释很多。从这张图上,看到传播的分布,看到中心结点的价值。数据量大了,可视化就以交互的方式,在线的方式呈现。
今天的可视化跟过去不一样,过去先由data去看这个数据解释了什么,现在直接可视化,然后感知这个数据是什么样的东西。我们先可视化再去寻找数据内在的逻辑,在这里面我们可以看到很多可感知的东西需要我们去探查。
可视化需要对关系的洞察
在这个过程中,我们会发现很重要的是对一些比方说人际关系,特别是社会网络,包括人与人之间的关系的呈现。我们需要找到人际关系的洞察,对复杂的网络我们也要需要展示。
在这个过程中可以看到像这样基于地理信息,报表的方式去呈现我们想表达的数据。包括以动态的方式去筛选,这些东西都可以在线,从这个角度我们可以去做很多类似的这样一些东西,包括地理空间的问题,包括统计报表。特别是台风,各种台风的走势,这条线是怎么走势的,不同地区暴风雪的走势情况,后面都有地图去跟着,包括统计量表。像这些东西都会产生,包括我们所看到的地球,会发现这个地球里面我们会知道什么呢?所以我们对地理信息进行可视化。
我们知道地理信息天生具有可视化的特点。我们会发现在一个地图上,我们可以感知到这个地图长什么样,我们知道新加坡怎么那么小,马航空M370跑到哪去了,习大大为什么要在哪签署港口开发协议,会是什么样呢?我们也希望知道天津滨海的爆炸,地图的情形是什么样,我们要观察地球,这种观察需要我们去思考如何从数据中洞察出来。
比方说我想知道二三环内多少人?我想知道甚至我将来知道落在故宫祈年殿的人流量是什么?
我拿到北京市每一个交通线路,甚至每一个公交站,我们都能够通过可视化感知到这个公交站,以及方圆1公里,方圆100里是什么样的范围。这里可以看到如果从地理信息上时时的感知这样的位置。百度、腾讯都有一些相关的街景地图,时时的统计,使得我们更好的感知我们带来的这种数据所影响的东西。比方说智慧城市,比方说发生的热点事件,如果我们能够把一些人所谓的社会关系,跟他的地理信息以及本身的属性能够融合在一起,以可视化的方式我们就可以感知这个社会。
当我们谈到数据可视化的时候,数据可视化本身就是,本身它就是叙事手段,也是一种批判性思维。
培养数据新闻的艺术工匠
对于数据新闻来讲,传媒大学是最早在全国高校建立数据新闻专业方向,我们很早在数据可视化领域一直在探索,我不是要培养数据科学家, 我希望培养懂新闻的数据艺术工匠。
马克思有一个很著名的理论,人和动物最大的区别是什么?使用工具。他说的是制造工具,我改成使用工具。
传统的新闻人才跟今天的数据新闻人才最根本的区别是什么?最根本的区别应该掌握工具。
这种工具是什么?我们希望去寻找一个工具箱,比如对于可视化工具包来讲,我们制作了这样一个工具包,在工具包里有各种各样的可视化工具软件,这些工具可能专门去解决地理信息的,包括图表的。我们也希望能够去解决更多的一些。这些工具包后面会放开,有时候希望我们的同学可以看到,今天去做这些可视化的工具并不太难。一个人的生平事件,或者一个事件的时间线,包括以地图的方式去讲故事。甚至声音,甚至图片的导航,这些东西都会产生。
作为数据新闻工作者,或者实验室希望描述MH370的失踪轨迹,希望描述一条船,希望描述一个大陆上这个线是什么,完全可以以更好的方式让受众感受到这种东西。一个是依靠对数据的洞察,一个是弄清楚让我们去感知这个我们想表达的东西。
数据新闻人才跟我们的传统的新闻人才很重要的差别就是要掌握工具。这些工具随着我们使用的熟练,从可视化的视角来讲,一直是科学和艺术的和谐统一。
本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「我们」留言处理。