导航· 设为首页· 加入收藏· 手机腾讯网· 腾讯网首页
新闻博客论坛评论
财经证券基金理财
娱乐明星电影音乐
体育NBA足球综合
汽车房产家居家电
科技数码手机下载
女性婚恋育儿
时尚健康旅游
读书原创教育出国
游戏动漫动画星座
视频直播图片
世博公益儿童

您所在的位置: 腾讯首页 > 科技频道 > 互联网评论 > 正文

   

互联网周刊:人物搜索众生相
http://tech.QQ.com  2008年09月08日18:30   互联网周刊    我要评论(0)

人物搜索铺开了一张包罗万象的大网,这种全新的使用体验,就像DOS系统到Windows的革命一样。本刊记者 马荟

有人的地方就有江湖,人物搜索的江湖越来越热闹了。

人物搜索与一般的搜索引擎服务不同,内容只限于和人有关的信息。几乎只要是在互联网上出过名的人,就有可能搜到他或她的人际关系圈、所在的组织机构、头衔、作品信息等等。而除了具体的人名,还可以通过关键词来匹配相关的人物,比如在搜索“最牛”的人时,就会出现具备相关特征的人物结果,如最牛的钉子户某某、最牛的散户某某、最牛的校长某某某等。

从全球的范围来看,目前微软占整个互联网搜索市场的份额还不到10%,从搜索业务得到网络广告销售份额仅为5%,但这并不妨碍微软在谷歌顾及不到的人物搜索上大有作为。

8月中旬,微软发布了“追赶谷歌”战略。微软负责搜索与广告的高级副总裁Nadella表示,新增投资和新的深度搜索技术将帮助微软从搜索市场巨头谷歌(www.g.cn)手中获取份额。

虽然Nadella并未表明具体的产品和策略,人立方的推出意味着微软在中国搜索市场已经有所行动了,第一个版本的推广有种“润物细无声”的感觉,随着使用人数的增多和用户口口相传,这种后发先至的压力让谷歌、百度无法再熟视无睹。

大玩具

微软人立方关系搜索目前最大的亮点在于趣味性。

从超过十亿的中文网页中自动的抽取出人名、地名、机构名以及中文短语,并且通过算法自动计算出它们之间存在关系的可能性,同时索引了支持它们之间关系的网页文字。无论是曾经在网上曝光过的亲朋好友,或者人们饭后谈资里出现过的花边绯闻,都可以通过连线产生交集表现出来。经过加工处理的结果用可视化的方式展现,打破了人们常规的从海量重复的搜索结果中捡取有效信息的麻烦。

奥运期间,微软人立方搜索推出中国运动员的“全家福”,这个独具特色的人物关系图像是散落在银河中的星座。每个人以一个圆圈代表,以不同的人物用不同的颜色体现出来,颜色越不同,人物关系关联性越弱。以搜索对象为圆心,从每个圆圈向四周散射出若干连线,发射出的辐射线条多少和半径体现人物的热度和受关注的程度。作为微软亚洲研究院的研究员,聂再清博士把人立方的开发看成一种偶然,并没有过多的考虑商业应用的因素。“微软的Libra学术搜索(libra.msra.cn)做得很成功,后来,为了让这种应用更加大众化,我们在2006年5月份开始做人物搜索。人立方这个名字也是我们一位同事在午饭闲聊时想到的,后来越发觉得贴切。”聂博士对记者说。三人成众,立方代表幂的加乘,而这既体现了六度分隔的无限关系,也预示了未来搜索引擎将吸收网友的力量。

微软这个独具卖点的人物关系图采用的是Adobe(www.adobe.com.cn)的Flash而不是微软自身的Silverlight。聂博士不以为意,“从做研究的角度来考虑,Flash符合当时做程序的人的使用习惯,而且Silverlight当时还只是个Beta版本,没有正式发布。未来实现上,人立方搜索关系图会改回Silverlight。”

绘图谱

“人立方与传统搜索技术的不同在于传统的搜索引擎不会把人在互联网上的信息总结得那么好。从几十亿的网页中自动地抽取结构化的知识并用于搜索中是一次全新的尝试。将来,我们会把索引网页从10亿扩大到100亿。那时我相信绝大部分的用户都会用人立方来查询与人相关的互联网信息。”聂再清充满信心地说。现在人立方抽取网页中人名的准确率是97%,其中的主要障碍就是搜索对象的身份识别问题,即如何解决重名的现象。

在姚明的关系图谱中,出现了麦克格雷迪和麦蒂两个关系,这两个不同的名字指向的是同一个人。在其中的一条关系线中,姚明和李宇春因为“兄妹”的关系联系了起来,因为“人们都说姚明的妹妹是李宇春。”以孙悦为例,当在搜索框中输入“孙悦”时,关系图中可以看到与孙悦有关的好友、恋人、队友等人际关系。同一个名字指向的是两个现实生活中不同的人,一个是歌手,一个是篮球队员。

针对这种问题,聂再清表示,人立方的第二个版本会解决掉重名人的身份识别难点,抓取信息的时候识别有价值的网页,而不是抓取BBS上的口水帖和虚假信息。

搜商

以人为对象的信息搜索绕不开隐私权的问题。

2007年9月,Facebook(www.facebook.cn)宣布允许非会员公开搜索用户信息。这些信息包括用户的个人档案和照片等,而用户也可以通过改变隐私设置停止搜索引擎索引其信息,现在的校内网也具有这项功能。与微软和雅虎(www.yahoo.cn)的人物搜索不同,SNS网站提供的人物搜索服务基于用户对自身信息的设置并且可以随时修改,这与抓取网页的搜索方式相比多了些可控制的因素。国内的人物搜索网站还有中国人同学录搜索(alumni.chinaren.com)和百度空间搜人找人(hi.baidu.com/sys/uquery)等。

Spock网站的用户可以添加信息或对可以搜到人物的照片、tag、网上资料、相关人物等的准确度进行投票,自己可以“认领”这些信息,进行修改。

“人物搜索会更多地帮助那些无心找隐私的人。如果不希望被放上去,可以选择不被检索。”聂再清说。

微软数次提出收购雅虎搜索业务可以证明在搜索市场上的野心。而人物搜索网站不单要解决同名识别等技术问题,还需把一个成熟的市场培养起来,将用户一时兴起的八卦心态转化为稳定的使用习惯。

在人物搜索的市场上,抛开错综的商业布局,微软亚洲研究院最终的目标就是把网页搜索一行行的展示,变成对象搜索平面关系的铺展,“用户这种不同的使用体验对于搜索引擎来说,就像DOS系统到Windows的革命一样。”

专题回顾:微软Windows 7正式发售 [更多精选]
2009互联网大会
2009互联网大会
卫生部拟禁止使用体罚等方式治疗网瘾
[卫生部发布《未成年人健康上网指导》征求意见稿][评论]
[网瘾少年出走25天终回家][陶宏开叫板杨永信电击网瘾疗法]
 
纽约检方指控英特尔贿赂与威胁PC公司
[英特尔斥责纽约司法部长反垄断指控是“火上浇油”][评论]
[欧盟对英特尔处反垄断罚款14.5亿美元][英特尔称遏制合理竞争]

[责任编辑:michelma]

手机看新闻】 【一键订阅新闻】 【返回科技首页】 【论坛  】【发表评论(0)
分类信息
企业服务
招商信息

热门新闻排行

IT新闻

互联网

通信

网评

全球20大半导体厂商排名 英特尔仍领先三星
Nvidia自建漫画网站 讽刺英特尔打压对手(图)
联想战略明年3月前不变:重视中国核心业务
杨元庆:Windows 7有助于联想拓展市场
Nvidia CEO:英特尔遭反垄断指控罪有应得
PC厂商:微软Win 7上市未能引爆电脑市场需求
分析称2010年电子阅读器销量将翻五番
前微软员工唱反调:Linux将把Windows赶出市场
Sun第一财季营收下降25% 甲骨文收购连累经营
分析称Win 7加速微软衰败:成软件界通用汽车
淘宝信用欺诈调查:6700元刷出皇冠卖家
全球10大互联网资产排行榜:微软第一谷歌第二
新一批低俗网站名单曝光 雅虎奇虎在列
谷歌美女副总当选时尚杂志年度女性大奖(图)
史玉柱20件趣闻:马云拉他去看《色戒》
南京出现删帖公司 自称只要给钱没删不了的帖
欧盟要求谷歌微软雅虎缩短搜索记录保存时间
Facebook承诺清理欺诈广告 已封杀两广告网络
51.com称公司08年营收近1亿 仍处于盈亏边缘
谷歌CEO:不犯微软错误 不会遭反垄断调查
王建宙:不进入谷歌地盘迟早会被对方干掉
第三季度智能手机出货量创纪录 同比增4.2%
谷歌搜索首页为Droid手机促销 曾投放G1广告
传苹果将于明年三季度发布CDMA版iPhone手机
华为Android手机热销欧洲 明年推更多机型
王建宙挖来罗川:中国移动需要互联网疯子
11个物联网研发机构在锡落地 总投资超2.76亿
谷歌Android Market迎来Photoshop移动版
苹果法国卢浮宫专卖店今天营业 与微软抢风头
北京电信预存话费送3G手机 比例高达70%
百度7000员工启动大搬家:李彦宏生日前完成
“百元笔记本”将被淘汰 平板电脑取而代之
分析称Win 7加速微软衰败:成软件界通用汽车
调查显示09年中国山寨手机销售量达1.45亿部
南京出现删帖公司 自称只要给钱没删不了的帖
李开复创新工场将成立台湾分公司 已有时间表
调查显示09年中国山寨手机销售量达1.45亿部
淘宝信用欺诈调查:6700元刷出皇冠卖家
谷歌美女副总当选时尚杂志年度女性大奖(图)
奇虎掀人才争夺战 宣称网罗近半网络安全牛人
热点信息

网友意见留言板
关于腾讯 | About Tencent | 服务条款 | 广告服务 | 腾讯招聘 | 腾讯公益 | 客服中心 | 网站导航
Copyright © 1998 - 2009 Tencent. All Rights Reserved
腾讯公司 版权所有