无障碍说明
腾讯科技科技 > 科技专题 > 腾讯开放平台大会 > 正文

Automated Insights:机器写作正在创造客观价值

腾讯科技[微博]黄媛2014年11月13日07:59

[摘要]Automated Insights去年他们生产了3亿个报道,收入也在不断增长。

Automated Insights:机器写作正在创造客观价值

Automated Insights副总裁Adam Smith

腾讯科技 黄媛 11月13日报道

11月12日,在2014年腾讯网媒体峰会上,AutomatedInsights副总裁AdamSmith畅谈了他们是如何利用机器写作革新内容服务的生产方式。

在个性化定制的基础之上,AutomatedInsights能以人力难以企及的规模生产真人口吻的内容。去年他们生产了3亿个报道,今年能上10亿,明年还会更多。与之同时,他们的收入也在不断增长。

规模效益:雅虎“幻想运动”过去是生产一个报道给3000万人看,现在AutomatedInsights帮助它给3000万用户定制生产内容。美联社每季度200个报道的效率被提高到3000-5000个。

个性化:针对个人健身运动,用户可以为自己的内容服务定制风格,比如选择一个毒舌的教练督促自己,或者一个阳光教练鼓舞自己,或者不偏不倚、只说基本事实的教练。

技术壁垒:我们有专利权。同时我们所在的领域壁垒比较高,让机器和人一样行为需要付出很多的努力和技术投入。另外我们的技术核心包括,随着时间的推移和数据的增多,即便阐述的场景相似,但是机器可以用更适合用户的方式生产一个新的报道,这非常难。

广告的个性化:我们和Edmunds.com合作,获取汽车数据。通过vin(车架号)数据,能够了解到关于这辆车的细节,然后把这辆车和全美百万辆其他车做对比,然后分析出每辆车的特别之处,而不仅仅是车型的区别,并且分析出为什么特定的用户会对这辆车感兴趣,比如是因为它的娱乐系统吗,还是加速器,等等。总而言之,我们可以根据每辆车的独特性生产出一篇专属报道。

本届媒体峰会的主题是“引爆新注意力”。中外新兴媒体高层齐聚一堂,聚焦前沿科技,见证新闻生产方式的重大变革。

采访实录:

腾讯科技:AdamSmith先生,您好!非常欢迎来到我们腾讯科技的媒体高峰论坛。您所工作的Automatedinsights是非常前沿的新媒体平台,使用独特的工具用机器生产内容,可以请您介绍下吗,用简单的语言向我们解释下那些技术?

A.S.:当然。AutomatedInsights是家美国公司,我们的平台叫worksmith,它可以收集关于任何话题的各种数据。拿到数据后,我们从中寻找模型、趋势、相互的关系,最终由软件来生成报道。真人说话一样的内容、完全由机器写作、能在任何屏幕展现,移动、网络、社交、电邮,而关键的是,我们还能控制作者的语调、为百万人群中的每个人个性化定制内容。

这意味着如果我有你的数据,你的个人情况、你最喜欢的运动队,我可以给你一个特制的报道讲述者,用你的数据讲关于你的报道,讲述的是你通过其他方式没办法得到的内容、讲述的范围也是你用人力所达不到的。今年,我们大约将发布超过10亿个报道,话题包含商业、智识、金融、房地产、体育、销售报告、还有更多。

腾讯科技:有什么是没被包含的吗?

A.S.:当然也有。有很多话题是有数据存在,但我们还没有开始用它们来讲报道的,但这只是时间问题。一旦我们训练wordsmith平台学习那些市场领域、并积累数据,我们就可以开始个性定制但讲述报道。

腾讯科技:如果我是一个用户,我应该怎样做才能使用你们的内容?

A.S.:这取决于你是在哪里找到我们,以及你在寻找怎样的内容。我们在为公司的个体员工服务,也在为媒体平台上的每个个体用户服务。比如在美国我们和雅虎正在合作关于幻想运动(fantasysport)的内容,用户可以选择橄榄球运动员,朋友之间相互比赛,在美国每周有超过3000万用户使用这项内容。而我们为雅虎所做的是,为每一对匹配的对抗组讲报道,你能够知道你的队伍表现得怎样,你的投球表现如何,胜利了还是失败了。雅虎曾经的做法是发布一个报道,让千百万人同时读它,我们让它做到了能够发布千万个报道,而且每个报道都是独一无二、专门为用户定制的。

而像今天也在这里的美联社,我们做的是收集公司公开盈利报告的数据,最终提供分析每家公司的发展情况、解析它们金融策略的报道。以前美联社每季度生产大约200个报道,我们使他们现在每个季度能生产3000-5000个报道。制作更迅速、到达范围更广泛,而他们的记者可以解放出来专注于做更多注重人性化色彩的内容,同时机器做它所擅长的大量数据收集整理工作。

腾讯科技:这真的很惊人!那现在机器写作发展到底到什么程度了呢,当然它能非常个性化的定制,但是它的表达和人的写作表达还是有不同吗,用户对它的使用反馈怎样?

A.S.:这又取决于用户想要生产的是怎样的内容。在和美联社的合作中,所产生的内容就像是人为书写的,但同时美联社自己也可以为其添加内容,比如记者获取但关于那家公司的新的信息。我们也能做有趣的、带入程度很高的内容,比如前面提到的和雅虎的合作中,我们让机器人写手具有幽默感,可以对你的赛队开玩笑,也可以对你的投球开玩笑,并搞笑式的告诉你怎样才能做得更好。

我们另外所在的一处市场是个人健身,有些人会用可穿戴设备记录他们每天的步数、跑步的圈数等等个人的行为,我们可以根据这些数据讲述报道,告诉他们自己的身体正在如何变化、怎样让周围的人们更喜欢他们,记录下地点、目标、体重等等。而且,用户可以自己选择讲述模式,或者是一个毒舌的教练督促自己开始锻炼,或者一个比较鼓舞人心的教练,或者就像美联社那样的只是告诉你基本事实的教练。所以,关于wordsmith很美妙的一件事就是,无论话题、内容、结构、形式如何,它都可以制造出适宜的可用于各个平台的定制化内容。

腾讯科技:那现在在用户接受度上还有任何问题吗?

A.S.:我们是从体育运动开始讲报道的,橄榄球、篮球、棒球,我们已经练好了一套专门在这些领域讲报道的技术,可以真的非常有带入感。而当我们进入新闻领域时,我们就是以此为基础,同样制造的内容对于用户来说,也是最吸引人的。而一旦用户意识到这些报道是专门为其量身定制,他们就会愿意分享更多的个人数据,而这又会帮助增加报道的吸引力,正向循环。从每一个用户中,从每一个不同的行业中,我们发现这种讲述报道的方式,相对那种一层不变的只讲述一种报道的方式,是更吸引人的。

腾讯科技:那照这样发展下去,你觉得机器写作还是会有它的限制性吗,还是可以无限壮大,甚至某一天超越、甚至取代记者写作?

A.S.:我想在未来,当人们回想人力去收集数据、从数据中讲报道这种事情是会觉得有些好笑的。当软件来做的时候,可以迅速的过滤大量交换的数据,然后据此来定制生产内容,并使用到真实的交流当中,并且大规模的使用。从长远来说,这项技术是有极大优越性的,这是人工智能技术的发展。而随着时间的推移,我们可以让这项技术更加成熟,口吻更像人类,可以涵盖更多的话题和数据组。而从基本层面上讲,我们只是为人们提供可以更好的理解自己的工具。让更多的媒体机构、公司里的数据科学可以更具个性化的交流,在同事之间,朋友之间。这样可以扩大报道的影响力,而读者也会更喜欢。

腾讯科技:那这样的技术应用有什么不足吗?

A.S.:这也取决于我们的客户他们取舍发布报道的方式,他们想如何定制,如何给到用户。有的时候,用户只想要最简单的事实,他们不需要人性化的语气、幽默感、声音的表现力。要知道,能制作出将人们的情绪调动起来、很容易消化的内容,我们就是要帮助我们的客户能够吸引用户、能准确的理解用户是怎么在使用内容,进而改变讲述的方式,然后进一步丰富所讲报道的内容,为用户提供他们所需。

腾讯科技:很多媒体公司都面临着经营难题,你们这方面的情况如何,能靠广告带进大量利润吗?

A.S.:是这样的。我们和很多公司合作,在很多情况下我们都会用到不同的数据。以个人应用为例,比如那个健身运动,我们分析用户健身方面的数据,但我们还收集天气这样的外部数据去丰富我们的内容。所以,我们的商业模式是或者从和客户一起生产的内容中去分成这些内容所带来的广告利润,或者是收取客户雇佣我们生产规模内容的佣金。我们现在有70家客户,分散在各个行业。去年我们制作了超过3亿个报道,今年数量超10亿,再下一年还会更多。继续在大量的数据中去寻找有趣的角度,制作有趣的报道,独一无二的讲述方式,数量级别成千百万,而且是为每个用户量身定制。

其中一个领域是汽车,我们和Edmunds.com合作,获取汽车数据。通过vin(车架号)数据,能够了解到关于这辆车的细节,然后把这辆车和全美百万辆其他车做对比,然后分析出每辆车的特别之处,而不仅仅是车型的区别,并且分析出为什么特定的用户会对这辆车感兴趣,比如是因为它的娱乐系统吗,还是加速器,等等。总而言之,我们可以根据每辆车的独特性生产出一篇专属报道。

腾讯科技:您的意思是可以帮助广告商寻找目标客户群吗?

A.S.:是的。我们的确帮助很多公司与广告商合作。我们可以获取读者面对特定广告的实时信息,然后把这些广告和与广告相关的内容实时反应在读者面对的报道场景中。因为我们了解这个读者,也了解这个广告,我们有方法把两者相结合。

腾讯科技:这可以是实时的?

A.S.:对,可以是实时的。我们的局限性在于数据的有限性。只要有足够的数据,我们就能生产出一篇相关报道。而我们很多的报道都是实时的。去年,我们生产的报道量达到了每9.5秒一条。而在有些场景下,我们可以做到每秒生产3000条报道。

腾讯科技:机器写作的发展如何迅猛,这让你们自己感到惊讶吗?

A.S.:我们都很兴奋。当我们刚起步的时候,我们就觉得我们的技术可以运用在很多领域的信息报道中。而无论是用户还是读者,看到我们机器撰写的信息都非常兴奋。而他们愿意公开更多自己的数据之后,我们的机器写作也可以更加优化,也可以分享给他们更多的信息。机器写作的前景令人浮想联翩。我们起步于2007年,这几年已经发生了长足的进步,当然未来会更美好,不仅仅是新闻,还包括别的信息领域,还有太多的领域会等待我们去发掘。

腾讯科技:你们的创始团队是怎样的,像极客那样人吗?

A.S.:是的,我们喜欢叫自己是极客。我们的创始人曾经在思科工作了13年。他的专长是自动化。同时他还撰写了12-13本科技相关的书。他总是在思考如何可以写一个程序让机器变得更像人。他不仅仅花大量时间写程序,让机器自动化地读取信息数据,而且也帮助其他人更好地编码,教会别人用一种新的编码语言。他总是探索,面对数据的话,机器是否可以被训练得和人一样,这是我们公司的起点。他有强烈的欲望去探索数据的进一步可能性。很多时候,如果你想要展现数据,你会用图表,这是一种方法,我们也会使用。但是问题就是,你需要读者在面对图表的时候得出自己的结论和判断。但是叙事体的好处在于,作者可以给读者解释图表的具体含义是什么,所写即所见。而我们公司想要做的事情,就是通过一种方式来直接向读者呈现这些数据到底是什么含义。同时,告诉每个个体,你自己的数据是什么样的,从来帮助大家做出正确的决定,调整行为选择。这些个体数据包括金融数据,销售数据等等。

腾讯科技:你们的技术门槛高吗,会容易被复制吗?

A.S.:我们有专利权。同时我们所在的领域壁垒比较高,让机器和人一样行为需要付出很多的努力和技术投入。另外我们的技术核心包括,如果接受到的数据和历史数据相似的话,机器可以有能力用另外一种叙事方式表述出来,而且我们会通过对比历史数据让机器生产的报道保持用户的参与度和粘性,也就是说随着时间的推移和数据的增多,即便阐述的场景相似,但是机器可以用更适合用户的方式生产一个新的报道,这非常难。也是我们的创始人一直在努力去达到的目标。我们还在不断探索新的领域,解决新的问题。面对未来,我们很兴奋。

腾讯科技:现在你们公司已经取得一定成功,人们渐渐接受这种信息报道方式。但是在刚起步的时候,遇到哪些困难呢?

A.S.:的确,在大家都没有见过机器写作之前,如何跟别人解释机器可以和人一样行为,能否找到合适的数据去“训练”机器,以及读者是否愿意接受单调的纯数据,而不是去盯着漂亮的图像看,这些都是大问题。但是,当我们在体育,金融,房地产等领域不断尝试之后,我们发现读者是愿意读数据的,而且也愿意去分析更多数据。这让我们不仅可以展现机器可以和人一样写作,而且实际上这些机器写出来的文章可以和人写的去竞争,而且还能获得更大的关注度。

腾讯科技:您本人在公司中是负责销售业务,您本人肯定和客户有很多交流,你怎么跟他们解释你的产品还有你们的理念

A.S.:有些时候,我们的潜在客户是已经了解和看到机器写作的群体。他们曾经在AP,雅虎或者我们的其他客户平台上看到过我们的产品。他们会发现,不会有人可以写出这样的报道。比如用户和朋友一起打fantasy篮球,没有公共新闻媒体会去专门为这些客户写报道,但是我们的机器就可以。当用户发现这些报道是完全根据每个人的兴趣量身定做之后,他们就会去找这种信息的源头在哪里。然后这些人就会来找到我们说,可否用你们的技术为我们的销售团队来写报告。

基本上,用户的中心思想就是,这些报道我们无法通过人力来完成,能不能借助你们的技术系统来实现呢。当然,如果不了解我们产品的人,还是会用质疑的眼光看待我们。但是现在我们在渐渐建立用户基础,我们已经有成功案例可以展现给其他潜在用户看。如果这些潜在用户愿意分享数据的话,我们也可以给他们展示我们的系统可以为他们的数据做到哪些事情,做一个试用的展示。

腾讯科技:那当用户提出一个具体问题,需要你们来解决的时候,大概需要多久你们会提供一个解决方案呢?

A.S.:看具体情况。一般在30天到90天之间不等。我们需要这段时间来确定报道的样式,训练机器,通过改变不同变量保证信息创建的畅通,也要做质量检查等等。然后我们才会把这套系统向客户展示,然后正式上线。

腾讯科技:那么目前的盈利增长如何,和用户量的增长相当吗?

A.S.:是的,盈利和我们的客户增长量是一致的。我们收费体系当然不会是按照单条信息来计算,因为我们的部分客户一天的报道生产量大概是2000万条。按条收费就会觉得不太合理。但是只要我们生产的信息维持读者的参与度和粘性,而且读者愿意从客户方面购买或消费更多的信息的话,我们就可以和我们的客户一同成长。

腾讯科技:准备在中国寻找业务机会吗?

A.S.:当然。这也是为什么我今天会来出席论坛。我们公司的长期目标是用我们的技术体系去生产不同种语言的报道。并不是翻译,而是接受本土语言的数据,然后生产。除了英文写作之外,我们已经尝试过德语和西班牙语。亚洲国家语言将会是我们长期的攻克目标。

[责任编辑:jasongwang]
您认为这篇文章与"新一网(08008.HK)"相关度高吗?
标签
媒体

阅读更多

相关专题:

  • ·腾讯开放平台大会订阅

相关阅读