6天“写”200多篇!今日头条搞出一个写稿机器人
里约奥运会开赛一周,AI机器人「张小明」通过对接奥组委的数据库信息,实时撰写新闻稿件,以跟电视直播几乎同时的速度发布稿件。据了解,张小明主要报道乒乓球、网球、羽毛球和女足的比赛,6天共生成超200篇简讯和资讯。 张小明是今日头条实验室研发的AI机器人,可以通过两种文本生成技术产出新闻:一是针对数据库中表格数据和知识库生成自然语言的比赛结果报道,即简讯;二是利用体育比赛文字直播精炼合成比赛过程的总结报道,即资讯。 来看看张小明写的简讯: “丁宁本轮的对手是现世界排名第7的韩英,实力不俗。但经过4场大战的激烈较量,最终,丁宁还是以总比分4:0战胜对手,笑到了最后,为中国延续了在这个系列赛事中最终夺冠的机会。“ 据了解,张小明平均每天产出30-40篇稿件,以短讯为主。截至目前,张小明的《奥运会乒乓球女单铜牌赛金宋依(朝鲜)4:1奥运名将福原爱(日本) 轻松摘铜》,在头条号获得超过5.4万用户的阅读量。 除了短讯,张小明还能撰写长文资讯: 全篇821个字,张小明通过数据库对接、信息搜集、文本生成、润色完成报道,最后发布、推送到今日头条手机客户端。 张小明到底是什么来头? 张小明,英文名Xiaomingbot,是今日头条头条实验室的研发成果,其「写稿」模块是由头条实验室与北京大学计算所(万小军团队)联合研发而成。 这是国内第一款可以报道奥运赛事的人工智能机器人,在结合了最新的自然语言处理、机器学习和视觉图像处理的技术之后,通过语法合成与排序学习生成新闻。 相比国内第一代写稿机器人——腾讯的「Dreamwriter」和第一财经的「DT稿王」,张小明的写稿技术已经进入是第二代写稿水平。与第一代机器人相比,张小明特征显著: 1.速度快数据库数据更新的2秒之内,即可生成新闻稿并完成发布。 2.样式多既可以生成长的详细比赛描述总结,也可以生成简明扼要的快讯简报,以前的自动体育新闻只能生成较短的文章。 3.自适应根据比赛选手的排名,赛前预测与实际赛果的差异,比分悬殊程度,可以自动调整生成新闻的语气,并使用感情色彩的词语,如“实力不俗”、“笑到了最后”等。 4.自动配图以前的自动新闻都只能生成文本,通过自动选图技术,张小明可以给新闻配图,更加生动形象。 据了解,目前在做奥运报道的机器人只有两家——《华盛顿邮报》的「Heliograf」 和今日头条的头条实验室「张小明」。 “张小明并非想取代记者。相反,新闻机器人是记者的助手,可以帮助记者更高效的完成新闻报道工作。”头条实验室负责人李磊博士说道: “张小明最大的意义在于,面对奥运会这样同时举行上百场比赛的综合赛事,记者很难关注到每一场比赛,而机器人可以任劳任怨的为每一场比赛报道,无论这场比赛多么冷门和不重要。传统新闻理论并不认为这些冷门比赛或者热门比赛(比如乒乓球)的前几轮小组赛有新闻价值,可是通过我们的平台测试,我们发现对冷门场次的报道任然有可观的阅读量,这个阅读量非常长尾,而新闻机器人可以弥补对这种长尾的新闻需求。” 奥运会进行到第五天,已经有超过25万用户通过张小明的报道获取赛事战报,他还在孜孜不倦地,以2秒种的生成时间,发布着每一场赛事的新闻稿。 |
关键词:张小明,机器人,写稿,总比分,赛事,华盛顿邮报,小组赛,传统新闻,长尾,福原爱 |