Home > 我就是未分类 > 信息检索方式会再次改变吗?

信息检索方式会再次改变吗?

September 28th, 2005

10年前,yahoo成立,他的崛起靠的是分类搜索。7年前,google诞生了,又是搜索,不过是关键字搜索。

7年以后的今天,出现了wiki,tag,rss等一系列的名词,人们又开始对信息的检索做出一些尝试。

这是迫不得已的事,信息量日益庞大,现有的信息检索方式已经慢慢的跟不上需要。这主要有以下几个问题。

第 一个是随着信息量的增大,关键字检索开始变的复杂了。单纯靠几个关键字已经很难得到满意的答案。一个关键字往往会出现无数符合条件的搜索结果,普通的关键 字在某些时候已经不足以把信息圈定在足够小的范围。有时候为了得到足够精确的结果,我们不得不绞尽脑汁的思考到底用什么关键字,怎么组合。相信随着互联网 信息的日益增加,这种矛盾会更突出。这时候不得不借助分类搜索,虽然可能层次多些,但比起有些时候绞尽脑汁的想关键字,这种成本更小。

另 外一个问题是信息同质化。天下新闻一大抄,抄袭遍地皆是。基本上一个关键字输进去,几页都是相同的结果,只是出自网站不同,上面的广告不一样.这种搜索结 果极大影响了信息检索结果的价值。网络上信息的严重重复,我们需要借助合理的检索方式进行过滤,可是几乎现在所有的搜索引擎都做不到这一点。

还有个问题是对搜索结果的排序上。搜索引擎很难判断各网页上的信息对用户提供的几个关键字的可用度的高低。它只知道符合不符合,但是在都符合的情况下,哪个会更符合?这很难有个标准。「从许多优质的网页链接过来的网页,必定还是优质网页」,真的是这样吗?虽然有些时候,这个标准很好的对检索结果划定了重要性,可是在信息量十分巨大的时候,一个网页网页对一个检索它的关键字是否优质显得越来越重要。单纯靠这个标准来对检索结果的排序已经越来越满足不了需要,是引入更细化的标准的时候了。

以 上还只是写比较明显的问题,几乎所有用户都有对搜索引擎大发脾气的体验,现有的信息检索方式已经显露出疲态。虽然改变信息的组织方式是最根本的解决办法, 但成本太高。语义网的概念提了那么久,真正的进展,或者只有近期的“tag”能勉强算一点。对现有的检索方式的改进,至少在近期内是不错的解决办法。

下班了,500里加急赶这么点,有时间再说啦。

我就是未分类

  1. No comments yet.
  1. No trackbacks yet.