腾讯科技2016科技 > 要闻 > 互联网 > 正文

揭密维基百科幕后:数百款自主程序进行维护

2012年07月28日01:21腾讯科技[微博]观海我要评论(0)
字号:T|T

[导读]人工智能程序bot执行了大量的编辑和管理工作,它们删除恶意破坏性的条目和粗言秽语、组织和目录条目,处理大量的幕后工作,保证百科全书平稳、有效的运转,保持网站的外观整洁和风格统一。

揭密维基百科幕后:数百款自主程序进行维护

数百个自主计算机程序来协助保证百科全书的运作(腾讯科技配图)

腾讯科技讯(观海)北京时间7月28日消息,据国外媒体报道,维基百科由全球数万名志愿者编写和维护,反过来,这些志愿者则由数百个自主计算机程序来协助,以保证百科全书的运作。

维基百科的一个页面显示:“阴茎是男性的性器官。”

这一陈述是无可争辩的事实,因此可能值得列入维基百科之中,但它并不属于网站有关美国最高法院及其法律职责的条目范围。

当南卡罗莱纳州一名匿名维基百科读者上周提供这一条目时,该条目仅用了几秒钟就被发现并被删除。这种恶意破坏的行为不是被读者发现,而是被一款被称为bot(robot的缩写)的简单人工智能程序所发现。

ClueBot NG程序存在于电脑之中,对百科全书的大量内容进行检查,在破坏发生时,及时对破坏进行清理。维基百科随时都会有数百款程序对内容进行检查,而ClueBot NG只是其中的一款。ClueBot NG对于有关美国最高法院文章的修复,展示了bot已经成为维基百科项目中不可缺少的组成部分。

维基百科网站上一位被称为赫思福德(Hersfold)管理者在电子邮件中表示:“如果没有了bot,维基百科将会是一团糟。”

仅英语版维基百科的条目在本月就已经超过了400万条,这包括了约25亿个单词,相当于数百万的页面,比《大英百科全书》(Encyclopaedia Britannica)大50倍。维基百科通过数万名编辑,对所有语言内容进行维护,其中约7.7万名编辑每月编辑的次数超过5次。

但该项目过于庞大,其维护属于劳动密集型工作,因此不可能依靠管理员和编辑的力量,来保证项目运作的井井有条。这就需要bot的帮助。

澳大利亚佩思市一名19岁的学生克里斯·格兰特(Chris Grant)表示:“我们这里有个笑话说,有一天,所有的bot都罢工了,只是为了让我们知道,它们做了多少的工作。”克里斯在维基百科委员会,负责对bot进行管理。

格兰特指出:“网站将要求我们所有人做更多的工作,编辑的疲倦率将会更离。”

bot执行了大量的编辑和管理工作,这些工作繁琐、重复和费时,但却又非常重要。它们删除恶意破坏性的条目和粗言秽语、组织和目录条目,处理大量的幕后工作,保证百科全书平稳、有效的运转,保持网站的外观整洁和风格统一。

与实体图书馆比较,bot类似于学生,将图书放在书架上、把图书从一个系列转向另一个系列、为书籍添加条形码,以及执行其他简单任务,这允许训练有素的管理员,专注于政策和收购。

北卡罗莱纳州计算机程序员布莱德·乔什(Brad Jorsch)表示:“维基百科已经壮大到如此的规模,我不知道如果所有的bot都走光了,人们将会如何进行应对。”布莱德负责运行一款bot,以对标签进行追踪,提醒编辑为条目添加引文。

Bot几乎与维基百科存在的时间一样长。

维基百科成立于2001年,第二年,一款rambot针对美国一个城镇创建了3万个条目(以每天数千条的速度)。bot直接从美国统计数据中导出数据,条目读起来好像是由机器人编写的一样。这些条目短小、公式化,仅仅包括了统计数字的字符串。

但一旦这些条目被创建,编辑就将接手,填补有关条目的历史详情、当地管理信息和旅游景点等信息。在2008年,另一款bot通过从在线的美国国家航空和航天管理局数据库抓取一些数据条款,创建了数千条有关小行星的条目。

维基百科社区现在仍旧依靠bot编写条目的价值来进行划分。一些管理员称,仅罗列了一些数据点的条目价值不大,而另一些管理员则认为,任何新的内容都很不错。

这一争论的结果就是不再允许bot编写整个条目。但bot执行机械化维护的能力,则解放了编辑,使他们能够进行研究,编写条目,查看其他人的工作,以确保准确性。

格兰特表示:“我并不认为,人们清楚维基百科上维护的工作量有多大。”

一些管理员担心,一款叛变了的bot有一天会给维基百科带来灾难性的破坏。

格兰特指出,这些担心毫无根据。

例如,一个bot并非像是一部汽车,如果在运营中,一个部件失灵,它将关闭,而不是失去控制,撞上什么东西。

格兰特表示,有权删除页面、屏蔽编辑和进行其他严厉举措的bot,只是由具有管理权限的编辑来掌管。

如果bot遇到一个程序无法解释的情况,它们确实也会犯错。

管理员表示,由于维基百科对编辑状况密切追踪,因此当错误发时后,将会被很快修复。负责管理bot的人士表示,人类编辑不用担心,有一天他们将会被bot所取代。

布莱德表示:“对一个条目的编写,一个条目的校验,甚至是对语法和拼写的整理,都需要人类的判断。”

[责任编辑:sonicluo]
登录 (请登录发言,并遵守相关规定) 分享至: 腾讯微博
如果你对科技频道有任何意见或建议,请到交流平台反馈。到微博反馈

企业服务

热点推荐

推广信息