机器人写新闻 记者吃什么

时间:2015-01-29 14:25:43 

文/陈赛

不久前,美联社宣布,从今年7月开始将启用Automated Insights开发的程序撰写公司财报。只要输入一些数据,如公司收益报表之类,这个聪明的程序就能在几秒钟之内给你生成一篇新闻报道:

迪斯尼第一季度利润上升33%,超过分析师预期。迪斯尼,总部设在加州伯班克,本季度收益为18.4亿美元,去年同期则为13.8亿美元。每股收益从77美分攀升至1.03美元,Zacks分析师的平均预期为每股92美分……

文章流畅、自然,一般人很难觉察它竟出自机器人之手。据称截至2014年底,美联社用此方式完成了4400篇财报新闻,效率是人类记者的15倍。美联社并不是第一个启用机器人记者的大型新闻机构,福布斯网站早在两年前就已经启用Narrative Science的程序自动生成财经新闻。

2014年初洛杉矶4.7级地震的第一个报道者就是一位机器人记者——Quakebot。Quakebot是《洛杉矶时报》自己内部研发的一个程序,能实时监控美国地质调查局的信息,一旦出现警报,就自动提取相关数据,置入模板,自动生成一篇文稿,等待编辑的审查和发布。在此之前,他们还有另外一个类似的机器人程序,专门自动报告洛杉矶发生的凶杀案。

事实上,我们正生活在一个越来越由人工智能所定义的世界里——搜索引擎告诉我们哪些信息更重要,更有用;算法根据我们的兴趣和品味,告诉我们应该看什么电影,读什么书,听什么歌;警方利用谷歌地图和犯罪数据、社交媒体决定在哪里巡逻……

Narrative Science的联合创始人克里斯蒂安•哈蒙德两年前宣称,计算机将在未来15年内写作90%的新闻。他还预测,他们的算法将在5年内获得普利策奖。

机器人到底是怎么采写故事的呢?

首先要采集大量高质量的数据,建立一个庞大的数据库。

然后,从这些数据中“计算”出哪些有新闻价值。所谓新闻价值,翻译成机器人的语言就是“关注异常数据”,如最小值、最大值、异数、大起大落、被超越的阈值等。

第三,选择故事的“角度”。如一项体育赛事的报道角度可能是“拉锯战”“英雄式个人表演”“强大的团队合作”或者“咸鱼翻身”等。算法会按照重要性对各种可能的角度进行排序,并由此形成文章的整体结构。

第四,将当下的数据嵌入模版,并按“原作者”提供的词汇生成句子。

一直以来,我们都相信人类与文字的关系如此独特而深刻,没有任何程序能够复制写作的体验。但在分析这些算法的过程中,你会惊奇地发现,写作的过程在很大程度上是可以量化和建模的。同一篇报道,它们既可以写出《华尔街日报》式的冷静内敛,也能表现更活泼的博客风格。至于文笔,我相信将来一定会有人开发出像“海明威App”这种应用,试图教我们人类如何写出海明威的风格呢。

或许这是我们唯一可以安慰自己的地方:机器可以根据格式和语法规则写一首诗,或者一篇小说,但全世界的数据加起来,也无法让一个程序理解爱、悲伤或恐惧。真正的新闻佳作最终都是关于人的,至少我最好的文章从来不是来自数据,而是来自采访,来自交谈,来自旅行,来自人生经验,以及漫步时偶然出现在脑海里的灵光一现。

看不过瘾?点击下面链接!
本站微信公众号:gsjx365,天天有好故事感动你!

相关半月谈

美图欣赏

半月谈排行榜