|
Google公司已经在其搜索使用的数据库中增加了超过10亿个的文档,其竞争对手雅虎公司也已经启动了类似的计划。 Google公司于当地时间本周二表示,其搜索索引中的文档数量 已经由8月份时的45亿增加到了超过60亿,这使得Google成为Web上最完整的搜索引擎之一。这一数字中包含有43亿个Web文档,800000个图像,8.45亿条Usenet消息以及一些与图书相关的数据。 Google公司的总裁、创始人布林说,我们搜索的范围将更全面。例如,原来搜索邻居的资料时可能得不到结果,现在就能够搜索到了。 雅虎公司也在悄悄地强化它自己的搜索引擎。雅虎公司于本周一推出了自有品牌的“爬虫”,在互联网上收集文档。据雅虎公司称,这一名为Yahoo Slurp的“爬虫”“将从互联网上收集文档,为使用雅虎搜索引擎的搜索服务建立搜索引擎。Yahoo Slurp还会建立文档的拷贝。 尽管雅虎公司的发言人黛安娜否认将放弃其长期合作伙伴Google,但其搜索服务将显示来自其技术的搜索结果。雅虎公司曾表示,它将在2004年第一季度推出取代Google的内部技术。通过收购Inktomi、Altavista和Fast Web,雅虎公司有几种技术可供选择。媒体进行的评测显示,对于一些商业性查询而言,Inktomi的搜索结果取代了Google。其它一些搜索结果则来自雅虎公司自己。 黛安娜表示,尽管如此,雅虎公司仍然在使用Google的搜索技术。她没有透露Yahoo Slurp搜索数据库中包含有多少文档。 Google公司表示,除了增加更多的搜索文档外,其“爬虫”也在挖掘更多的信息丰富网站。例如,其搜索数据库中包含的图像数量翻一番。这种扩展也延伸到了Web之外,例如,Google公司在其搜索数据库中添加了图书页。布林说,对于发布最好的搜索结果而言,内容广泛是非常重要的,因为这有助于用户搜索的内容能够显示出来。 布林表示,在最近的数周中,Google已经对其服务进行了约5次增强,这对搜索结果的影响比增加文档数量更大。尽管没有透露这些改进的详细情况,但他说,至少有二项改进旨在从其搜索结果中过滤垃圾邮件或虚假的文档列表。 在被问到开发多媒体搜索服务的问题时,布林说,他正在考虑这一问题,但仍然存在一些版权和技术性问题。他表示,最终我们希望能够覆盖全球的信息,无论它使用了什么媒介。
|