大数据时代推动了新闻业的变革,数据新闻是在此背景下兴起的一种新型新闻报道样式。本文以财新网“数字说”频道为研究对象,定性与定量分析相结合,探究其数据新闻的特点,找寻可供其他媒体学习借鉴之处。
目前国内的数据新闻尚处于探索阶段,“数字说”数据新闻呈现出的特点值得业内参考,为学者提供研究案例,有助于丰富理论体系,而它存在的不足也会对自身和其他媒体有所启发,推动我国数据新闻领域的整体发展。
当今社会已进入大数据时代,数据作为核心资源,推动着人们思维、生产、生活方式的重大变革。“大数据”为新闻传播业带来了新的机遇和挑战,“数据新闻”便是在此背景下兴起的一种新的新闻报道样式。德国之声记者米尔科·洛伦兹将数据新闻定义为一个工作流程:通过挖掘数据,包括收集、筛选和结构化数据,依据特定报道目的实现信息过滤,借助视觉化技术实现信息呈现。
财新网“数字说”频道设立于财新传媒创办的财新网之下,定位为“用数据解读新闻,用图表展示新闻,将数据可视化,为用户提供更好的阅读体验”,在国内的数据新闻实践中表现突出。自2012年10月25日上线至今,“数字说”专注于数据新闻制作,保持着较高的发布频率及报道质量,连续五年获得亚洲出版业协会(SOPA)卓越新闻奖,吸引了越来越多的人阅读。
“数字说”在数据新闻实践中积累了丰富的经验,得到国内外业界认可,具有重要的研究价值。本文以财新网“数字说”为研究对象,分析其数据新闻的特点,探究其存在的问题,找寻该频道可供学习借鉴之处。
财新网“数字说”频道在财新网下设有独立的网页,页面以白色为背景,分隔线为蓝色,左边三分之二的区域显示常规数据新闻,这类报道以经济类选题为主,平均三四天发布一则,由记者和制图小团队制作,在文字间插入静态数据图表,解读最新的股市行情、房价指数、纳税政策等。右边三分之一区域是大型数据新闻与可视化作品的集合,这类数据新闻一般是交互式网页,使用到的数据量大,运用的可视化技术更复杂,截至2019年1月31日累计发表56篇报道。
笔者使用GooSeeker(集搜客)软件,从“数字说”频道中抓取了自2015年1月23日《中国每天30万部安卓手机中毒》至2019年1月31日《中国非洲猪瘟疫过百有哪些新特征?》共1002篇常规数据新闻和56篇大型数据新闻的标题、制作者、发表时间等信息,用于量化分析,探究“数字说”数据新闻的特点。
前者是先有了适宜可视化的数据库,在对已有数据进行抓取、清理、分析的基础上,再查找资料,采访相关人员,挖掘出数据背后的新闻。例如《你的城市有多大》这篇报道,“数字说”从滴滴媒体研究院得到了全国主要城市出行半径、通勤时间等数据,由此产生了用人们的日常活动范围、城市功能区域分布来侧面反映城市大小的想法,据此记者采访了几位在北上广工作、家乡在南京、天津等地的人士,基于大数据比较任意两个城市的大小。
后者则是先确定了新闻的内容,或想要剖析的问题点,再去查找整理数据或是主动采集第一手数据。例如《高校师生关系调查》报道,财新网关注到近年来发生了几起高校学生自杀事件,起因都是和导师的关系不甚融洽,为了能深入地调研高校师生关系,财新网在2018年4月发起问卷调查,问卷涉及了帮老师做“私事”的时间频率、学生是否有心理困扰、给师生关系打分等问题。截至当年5月底共收到384份有效问卷,通过对回收到数据的分析,制作数据图表,再引申到国外高校的治理历程、下一步国内将如何改进等,整篇报道数据详实,对现象的剖析层层深入,发人深省。
将GooSeeker抓取到的数据新闻标题整合在一个文档中,去除其中的语气助词等没有实际意义的文字后,使用Tagxedo软件统计词频,绘制出了词云图。
根据词云图及数据显示,“数字说”采制的数据新闻以报道国内事件为主,国内与国际新闻比例为2.62;选题范围比较广泛,不仅有涉及“经济”“股市”的财经类选题,此类选题占比最高,也有关注“政府工作报告”“两会”“峰会”“十八大”的时政新闻和讨论“教育”“生活”的科教文卫、社会新闻等。
同时,“数字说”数据新闻选题多与社会中最新的引起大众关注的事件有关,贴近人们的生活。例如2017年底《国家宝藏》播出,以舞台短剧的形式重现文物背后的历史故事,极大地激发了观众了解文物的热情和对传统文化的自豪感,“数字说”趁着这次“文物热”,制作了《博物馆里的国家宝藏》,基于中国文物馆的数据,整理了2133家博物馆共235万件文物的朝代、质地、纹理图案,绘制时间轴、气泡图、面积图等,描述了中国文物图景。
从对具体案例的研究中可发现,“数字说”里的数据新闻常常先介绍国内与选题相关的基本情况,再将全球形势与中国对比,从时空上的比较中发掘中国存在的不足,提出可尝试的改进方法。
例如《中国的博物馆300000:1》,报道在中美两国地图上用亮点标注博物馆的位置,通过地图、条形图、词云图,对比了两国博物馆人均覆盖率、分布格局、名称、营收等方面的差异,展望今后中国博物馆的发展趋势。
新闻讲求时效性,但在互联网和移动社交高速发达的今天,在众声喧哗下,舆论关注的重点不断转变,真正有价值、能推动社会进步的新闻常常被淹没在繁杂冗余的信息中。“纪念日”板块正是为了改变这种新闻被遗忘的局面而设立的。
板块中,人们可点击卷轴状日历上的日期,跳转到对应的新闻,了解该事件发生的背景、最新进展、财新网相关的视频文章等,并可发表评论参与讨论。截止2019年1月31日,“纪念日”板块共报道了187个事件。
“数字说”里的数据新闻应该说都是深度报道,但却常采取消息报道的倒金字塔式结构,来突出事件的重点。为了在短时间内提供给用户最新鲜、最重要的信息,抓住用户的注意力,记者一般会在第一段用几句话简要地概括新发生的事实或事件的最新进展,在后面的段落中逐步介绍事件的起因、发展过程、带来的影响及背景资料。以《美国政府结束最长一次停摆 损失有多大?》为例,这篇报道在第一段便点明了主体、时间、事件,以突出此次政府停摆造成的影响。
梳理“数字说”中56篇大型数据新闻的数据来源,基本可将它们划分为七类:(1)财新网报道,如财新《新世纪》周刊文章;(2)除财新网外其他媒体公开报道,如新华社、《人民日报》的报道;(3)政府部门数据库,如国家统计局、教育部;(4)国际机构/组织数据库,如联合国、世界银行;(5)研究院、学者研究文章/书目,如中国指数研究院;(6)专业团体数据库,如ORCID;(7)企业数据库,如凯度、滴滴出行。
其中,政府部门数据库和财新网自己采集的数据是最主要的来源,均有14篇报道,使用专业团体数据库的最少,仅有3篇;多数新闻都使用了不止一种数据来源,这表明“数字说”使用的数据库权威性较强,注重从不同的渠道获取数据,通过交叉比对,避免单一数据源可能造成的数据错误、有倾向性等影响。
56篇大型数据新闻中有8篇未注明数据来源,它们的发表时间集中在2014、2015年,同时期的其他报道也只是简单地说明下由财新记者实地拍摄或者改编自财新《新世纪》周刊的文章,说明这时“数字说”尚未形成标注数据来源的意识,对数据的引用不规范。
从2016年起,“数字说”对数据的使用逐渐规范起来。如在2016年2月2日发布的《从调控到刺激 楼市十年轮回》的报道中,结语页上详细写明了数据来源和计算方法,此后的每篇数据新闻都会在结尾处制作者署名前列举数据来源,这一变化体现了对数据的重视和作者的严谨态度,真正在用数据讲新闻。
数据新闻制作者能搜集到的数据往往都是原始的、没有结构化的,这些数据本身很繁琐、枯燥,为了能让用户更好地接受和了解,“数字说”的编辑们会对数据做出一定的处理,将它们和生活中常见的事物联系起来,使枯燥、偏技术性的数据具象化。
例如《我们有多缺水?》用水杯中的蓝色颗粒表示用水量,白色滴水表示地表水资源,在一张大图上展示全国各省份的人均水资源量,凸显严重缺水的地区,“水杯”这一元素贴近人们的生活,让读者产生联想,对水资源短缺问题有更直观深刻的认知。
“数字说”的常规数据新闻因时效性的要求,制作时间短,基本以静态信息图表或GIF动图的形式呈现。大型的数据新闻则有较长的策划制作周期,互动性强,呈现形式更复杂。56篇大型数据新闻中,有42篇都是大型的交互网页。
在这些数据新闻中,编辑们会结合不同的选题和数据集灵活地选择数据图表类型,将要用大段文字才能解释清楚的复杂逻辑简化,提炼出要点,综合运用多种数据图表,如折线图、散点图、地图、时间轴、词云图、社会网络关系图等。
同时,“数字说”还会尽可能让一篇数据新闻里的视觉元素在颜色、风格上保持协调统一,根据不同的选题选择相应的主色调,优化视觉效果。例如《失稳的“亚洲水塔”》用的是与海洋颜色相近的深蓝色,其中的地图、流程图、柱形图都是从蓝色系中取色;再如《水平面下的阿尔茨海默病》选择了接近血液颜色的暗红色,报道中表示重点的文本、数据、图形都用暗红色标注,加以强调。
“数字说”非常重视用户的需求,为了提高用户的使用体验,设计了许多交互效果。例如鼠标滑到散点图中的每个小点时,显示出这个点代表的具体信息;几张图表随着鼠标滚动切换播放;点击选项进入不同的故事线等。此外可通过嵌入javascript命令,让用户填写表单,计算选项值得出结果。以《快来生成你的最佳缴税方案》为例,网页上加入了一个个税计算器,用户可参照自己和家庭的情况,在问卷中输入数据,填写完毕后点击“计算”按钮,网页后台便会根据编写好的程序算出用户需要缴纳的税款,这个设计让用户主动地参与到报道中,通过亲身体验,快速理解了新修订的《个人所得税法》的详细条例,比单纯用大段文字阐述要有趣得多。
诺贝尔经济学奖获得者赫伯特·西蒙曾说:“随着信息的发展,有价值的不是信息,而是注意力”。如今人们倾向于碎片化阅读,每天都对来自各种渠道的信息应接不暇。因此媒体想要达到理想的传播效果,就必须抓住用户的注意力。
数据新闻具有可视化、交互性等得天独厚的优势,但当文字和数据图表在版面上同时呈现时,就会争夺用户的注意力,让用户一眼看过去不知道是先阅读文字好呢,还是先去理解图表,抓不到重点,也分散了注意力。财新网“数字说”的数据新闻就常常遇到这个问题。例如当用户打开《移民去远方》这篇报道时,视线的中间部分地球模型一直在滚动,不断有光点闪烁,右侧有上千字的文章要阅读,难免会两边游移,最终只能是一晃而过,难以静下心好好理解新闻内容。
目前“数字说”数据新闻集中在PC端网站上发布,微信公众号“财新数据可视化实验室”自2019年1月7日发布了一篇对2018年报道的回顾后,截止到1月31日再无更新,且检索未查找到“数字说”的官方微博账号和客户端,由此可见,目前“数字说”传播渠道单一,这可能会降低用户的粘性,也增加了发展新用户的难度。
当然,就目前来说,受技术条件的制约,数据新闻在移动端传播的难度也较大。“数字说”的数据新闻很多是用编程完成的,一些效果只有在特定的浏览器,如Google Chrome、Firefox上才支持浏览,这种情况下移动端根本无法打开报道链接。此外,移动端因屏幕大小有限,通常只适宜竖版阅读,横向设计的图表不能在一屏上完全显示,图片的清晰度被压缩,一些重要的文字、数据会被模糊掉。种种因素都为数据新闻在移动端的有效传播增添了困难。
2017年11月6日,财新传媒正式对财经新闻启用“全面收费”模式,用户可开通财新账户,在“财新商城”中订阅“财新通”、“数据通”等收费产品。
财新网是国内第一家实行全面收费的新闻网站,“数字说”频道所有的数据新闻都需要用户付费阅读,没有付费的用户只能看到新闻的第一段话,这在一定程度上限制了传播范围,试想当用户觉得一篇报道很好,想与身边朋友一起讨论,分享到微信朋友圈时,其他的好友点开链接却会因没有付费看不到全文,这在潜移默化中形成了阅读壁垒,一些好奇心不足的用户就不会再点开第二次了。
耶鲁大学教授爱德华·塔夫特提出“油墨定律”,即最佳的图表应该做到在最有限的注意力时间内给读者最大的信息量,并做到耗费最少的打印油墨,占用最小的呈现空间。这一定律同样适用于数据新闻实践。
因此“数字说”在制作数据新闻的过程中,需要合理地应用数据,围绕选题过滤清洗掉无效数据,总结出规律或预测趋势。在设计数据图表时,应遵循简洁性的原则,一方面,不为了炫技而将适宜用文字阐释的部分可视化,注意文字和图表的平衡;另一方面,能从图表中获取到的信息便不再用文字赘述,做到文字和数据图表相互补充。
如今人们用手机上网已是常态,微信、微博等社会化媒体以用户为核心,强调用户间的分享、互动,提供了更多的内容传播渠道。
“数字说”需要重视起社会化媒体,搭建更广阔的、能够吸引到普通读者、利于推广的传播平台,财新数据可视化实验室可以在这些平台上发布最新的数据新闻,还可以介绍新闻制作的过程,举办学术沙龙等,让对数据新闻感兴趣的广大用户共同讨论阅读报道后的感受,分享优秀的案例,一起学习一起进步。此外还可以借助算法推荐机制,基于用户的个人喜好、关注重点等个性化需求,有针对性地推送不同题材、形式的数据新闻,实现精准传播。
“数字说”的数据新闻以信息图表和交互网页为主,今后“数字说”可以尝试更多元的表现形式,例如数据可视化视频。
数据可视化视频是一种适应“短视频热”的新的可视化形态,新华社打造了“MAGIC短视频智能生产平台”,在1分钟左右的视频中展示某一时间段内数据完整的演变过程,通过动画效果引导用户顺着故事线阅读内容。这种新的表现形式既能反映整体趋势,也可以体现更多细节。数可视创始人兼CEO黄志敏认为“数据新闻的短视频形式更易于传播,且容纳信息量更可观,其播放量能直接转化为收入,更符合市场需要”。
数据新闻是多学科背景、团队协作式的采制,财新网“数字说”的成功很大程度上归功于它组建了一支专业的、成熟的制作团队,其中记者、编辑、设计师、数据工程师等每个角色都发挥着举足轻重的作用。制作者们在完成好自己本职工作的同时,会主动地去了解其他成员的工作流程、运用到的技术软件,从而让自己不脱离制作链条,保证报道的完整性和团队的高效运作。
数据新闻的记者在拓展自身各方面综合能力的同时,需提高数据素养。既能从海量资料中挖掘出具有新闻价值的数据,不被庞大的信息海洋淹没,又能对选题做出评估,判断它们是否有做成数据新闻的可能性。
数据新闻制作者往往会陷入一个误区,即过度相信、依赖数据,缺乏对数据的判断、审视,忽视对新闻内涵的挖掘。实际上,数据是有局限性的,它必须在特定的情景中才有意义,数据也不一定是真实的。而“数字说”十分关注社会现象、新闻本身,这一点值得其他媒体学习。“数字说”的记者常去采访与选题相关的人士,用文字、语音、视频记录下被采访对象说的话,再加入到数据新闻中,这时采访内容既是对已搜集到数据的补充,又能从中挖掘到新的点,让新闻向更深更广的层面延伸。
因此在数据新闻采制中,记者应当有独立的思辨能力,围绕新闻的核心观点筛选数据,交叉比对不同的数据来源,以客观、真实、准确的态度报道事实,坚持新闻专业主义,服务于公众利益,将事实的原貌展现在读者面前。
数据新闻选题能否实施受到数据量的制约,再好的选题缺少充分的数据加以佐证也难以成行。目前我国的数据环境对数据新闻制作者来说是不甚友好的,专业、有权威性的数据库少,很多行业的数据都分散在企业手中,缺乏系统地归纳梳理,同时现有的数据库也不能直接使用,常出现数据缺失、格式混乱等问题。
因此媒体为了谋求更好的发展,需要升级数据系统,发掘多元的数据库,也可以借鉴国外一些媒体的做法,比如英国《卫报》推行众包模式,在网络平台上邀请用户参与新闻生产,由此建立起众包数据库,获得了极大的访问量。
“数字说”致力于为用户提供更好的阅读体验,在确定数据新闻选题、选取新闻叙事角度、处理分析数据、设计可视化呈现形式、加入互动效果等各环节中,不是从制作者的角度出发,将信息强行灌输给读者,而是站在用户的立场上,去思考用户可能对哪些话题感兴趣,迫切需要了解哪类信息,对哪种可视化形式的接受程度更高,使得数据新闻既能实现预期的报道事实、引导舆论、传播知识等目的,又能满足用户的信息获取、情感体验等多重需求,达到了很好的传播效果。
因此,媒体的数据新闻采制需贯彻“以用户为中心”的原则。在这方面,国内外都有不少可参考的案例,例如嵌入互动机制,通过点击按钮触发不同的故事线;设置超链接,开放报道所使用的数据,鼓励用户对数据的再次开发和利用,种种措施都有助于调动用户阅读的主动性。
“互联网之父”蒂姆·伯纳斯·李曾说过“新闻的未来是分析数据”。伴随着技术工具的成熟,数据新闻为新闻传播业注入了新鲜的活力,它重构了新闻的生产流程,找寻数据间的内在联系,以用户为中心,丰富可视化和交互效果,为用户提供了更好的阅读体验。
《卫报》“数据博客”前任主编西蒙·罗杰斯指出:“数据新闻是80%的汗水,10%的伟大的想法,10%的产出”,足见数据新闻制作之艰辛。以财新网“数字说”频道为代表的许多媒体正在探索数据新闻的创新路径,生产着优秀的数据新闻报道,未来数据新闻必将吸引更多的用户,发挥愈发重要的作用。
1.维克托·迈尔·舍恩伯格.大数据时代[M].杭州:浙江人民出版社,2013.
2.西蒙·罗杰斯.数据新闻大趋势:可视化报道的力量[M].北京:中国人民大学出版社,2015.
3.彭兰.网络传播概论第四版[M].北京:中国人民大学出版社,2017.
4.刘义坤,董明.数据新闻设计[M].桂林:广西师范大学出版社,2015.
5.郎劲松,杨海.数据新闻:大数据时代可视化传播的创新路径[J].现代传播,2014,(3).
6.陈力丹,李熠祺,娜佳.大数据与新闻报道[J].新闻记者,2015,(2).
7.彭兰.“信息是美的”:大数据时代信息图表的价值及运用[J].新闻记者,2013,(6).
8.陈积银,杨康.中国数据新闻发展的现状、困境及对策[J].新闻记者,2016,(11).
9.方洁,颜冬.全球视野下的“数据新闻”:理念与实践[J].国际新闻界,2013,(6).
编者按:近期,互联网应用适老化改造成为舆论热点。相比尚不熟悉互联网的老人,已经能够熟练掌握互联网应用操作的老年网民同样面临网络谣言、网络诈骗、虚假广告等陷阱,他们抵御风险的能力远低于年轻网民。…
在现代社会数字化与智能化飞速发展的当下,老年人与互联网之间的“数字鸿沟”已成为必须逾越的课题。2020年底,工信部正式印发《互联网应用适老化及无障碍改造专项行动方案》。…