导航· 设为首页· 加入收藏· 手机腾讯网· 腾讯网首页
新闻视频图片评论
财经股票港股基金
娱乐明星电影音乐
体育NBA彩票中超
汽车房产家居家电
科技数码手机下载
女性结婚育儿
时尚购物旅游
读书原创教育出国
游戏动漫动画星座
博客微博论坛
世博公益儿童

您所在的位置: 腾讯首页 > 科技频道 > 互联网新闻 > 正文

   

谷歌搜索引擎增加新技术 可搜索PDF文件
http://tech.QQ.com  2008年11月02日10:10   赛迪网  天虹  我要评论(0)

【赛迪网讯】11月2日消息,谷歌很少在自己的搜索结果中包含扫描的文件,因为它没有办法确定这个内容的性质。但是,这种情况将发生变化。谷歌称,它将使用光学字符识别(OCR)软件让网络浏览者搜索以Adobe系统公司开发的PDF文件格式存储的任何文件。

谷歌产品经理Evin Levey说,谷歌将利用这种技术把扫描的文件转换为文本文件。这样就可以对文件进行搜索、索引和返回为谷歌搜索查询的答案。这是我们要让全球的信息都能够访问和利用迈出的一小步,但是也是重要的一步。

谷歌针对网络的这种OCR蛮力应用程序预计还能够帮助谷歌的图书搜索。这是谷歌2004年在法兰克福图书博览会上发布的一个雄心勃勃的和有争议的计划。从那以后,谷歌以每天3000本图书的速度扫描全球主要图书馆中的图书。

虽然这个计划最初引起了版权的担心。但是,谷歌刚刚与美国作家协会和美国出版商协会就这个问题达成了和解。谷歌将能够在美国扩大在线访问数百万有版权的图书和其它书面内容。这个和解协议解决了挑战谷歌数字化、搜索和显示有版权的图书中的部分内容的法律诉讼问题。允许谷歌在没有版权拥有者批准的情况下与图书馆共享数字版本的图书。

然而,由于网络内容继续成倍的增长,当前搜索引擎技术基于文本的性质显然是不充分的。这是因为目前这一代搜索引擎只能找到有文本注释的多媒体文件。文本注释是一种费力的和耗费时间的过程。内容制作者经常忽略这个问题。

Adobe副总裁David Wadhwani解释说,我们正在初步地与谷歌和雅虎合作以显著改善网络上丰富内容的搜索。我们打算扩大这种能力的应用,使所有的出版商、开发商和最终用户受益。

专题回顾:联想移动原掌门接盘夏新手机 [更多精选]
网瘾暴力犯罪啥时候是个完
网瘾暴力犯罪啥时候是个完
联发科复制苹果iPhone商店 明年初推出
[联发科山寨智能手机 曲线涉足软件商店][苹果禁售iDroid软件]
[联通测试自开发平台 拟取代iPhone软件商店][评论]
 
2009年终 给三大运营商颁个奖
[2009年通信圈十大误解][运营商如何看待外来和尚念的经]
[手机实名制:运营商非诚勿扰][运营商或是物联网概念幕后推手]

[责任编辑:skylei]

手机看新闻】 【一键订阅新闻】 【返回科技首页】 【论坛  】【发表评论(0)
分类信息
企业服务
招商信息

热门新闻排行

IT新闻

互联网

通信

网评

热点信息

网友意见留言板