有些用户将RSS搜索误认为“博客搜索”。虽然很多博客网站提供RSS聚合功能(自动创建聚合是大多数博客软件的特征),但并不是所有博客网站均提供这项服务。此外,理论上RSS可应用于任何基于Web类型的内容。RSS从根本来讲还是一种相对简单的规范,它利用了XML,并遵循一种标准的方式来组织和安排网络内容。
事实已经证明,博客可以提供大部分RSS内容。此外,新闻网站同样也可以通过RSS实现内容聚合。大部分新闻站点已经实现这一功能。
并且RSS聚合将被更多地应用于其他类型的内容。譬如,用户可以利用RSS聚合获得天气预报、公司新闻及金融信息、包裹跟踪等等方面的信息。甚至一直以来倍受人们推崇的雅虎目录也已经实现了RSS聚合。
尽管理论上存在着上百万聚合内容,但要从中找到自己有用的相关的信息却非易事。一方面,主要搜索引擎均开始涉足聚合搜索,但截至目前还未有一家推出完善的聚合搜索服务。另一方面虽然也有一些规模较小、专业的博客和聚合搜索引擎,但由于它们缺少内容资源,同时博客和聚合内容中充斥着大量垃圾信息通常导致他们的搜索结果相关性极低。
RSS搜索引擎
互联网上已经诞生并发展起许多专业RSS搜索引擎,以下仅列决几个较为知名的聚合搜索引擎,更多可参考http://allrss.com/rsssearch.html
Bloglines(http://www.bloglines.com)
搜索引擎Ask Jeeves旗下的Bloglines,既是一个聚合搜索工具,又是一款聚合阅读器/新闻聚合器。Bloglines主页右上角放置了两个搜索框,用户可在第一个搜索框的下拉菜单中选择搜索范围,比如所有Bloglines索引的博客,个人订阅的博客,全部网站,或添加一个聚合地址至个人订阅;第二个搜索框则输入关键字。
Bloglines的高级搜索页面,提供有基于表格的简单布尔逻辑搜索功能,还可以按照流行度或日期过滤搜索结果,选择不同的搜索范围(所有博客、个人定制博客或个人定制博客意外的所有博客)。
Bloglines网站上公布了其已经被收录文章的总量,截至2005年9月8日为701,667,885。
此外,作为一款阅读器,Bloglines在聚合内容阅读,管理个人订阅等方面还有很多好用的特色功能。它集信息订阅、分享、发布和搜索于一体,相对于其他同类产品极具个性。
BlogPulse (http://www.blogpulse.com)
BlogPulse主要作为一卷跟踪博客世界的流行趋势和热门话题的工具而众所周知,实际上它还有一款很不错的聚合搜索引擎,同时它还拥有同类聚合搜索服务中最大的聚合内容索引库之一。BlogPulse网站上目前公布的索引量为,可确认博客网页15,870,290个。
BlogPulse的高级搜索页面提供有短语搜索,分别按照“包含全部关键字”、“包含任意一个关键字”和“精确关键字”三个选项,此外你还可以在这里创建自己的布尔算子搜索请求。另外,你还可以按照指定时间范围限制搜索结果,以时间或相关性排列搜索结果。
Daypop(http://www.daypop.com)
Daypop 是第一代博客/聚合搜索引擎之一,曾在2001年和2002年荣获Search Engine Watch最佳提名(Search Engine Watch每年对所有搜索引擎进行一次分类评选)。Daypop的运作完全依靠其创始人和所有者Dan Chan一人之力,因此较之其他同类工具缺乏一定的发展动力。
Daypop的高级搜索页面提供有基本的按日期过滤结果,此外还有其他博客/聚合搜索工具未曾推出的按指定语言或国家限制搜索结果。
Daypop搜索框底部显示了其当前搜索范围,涉及59000个新闻网站、博客网站及RSS 聚合。
Feedster(http://www.feedster.com)
Feedster 提供了多种有趣的特色功能,如订阅某个搜索请求并将其保存为一个feed,或通过电子邮件发送新的搜索结果。此外,较之全文本搜索,Feedster还提供有独特的搜索聚合内容内含信息和搜索聚合地址。在搜索聚合地址时,用户可以利用关键字或URL搜索,或者两者结合进行搜索。
在Feedster高级搜索页面,用户可将搜索范围限制在某个聚合地址,也可以是多个聚合。此外,还能过滤某些聚合,包括你自己的。
Feedster主页顶部显示其当前搜索量达到14,000,569个feeds(聚合地址)。
Findory Blogory(http://findory.com/blogs/)
Findory 是一款新闻搜索工具,同时具有独立的博客搜索功能。Blogory的主页版面看起来与Google新闻主页相似,页面顶部首先列出的是“top blogs”热门博客,接着是按照类别组织的其他博客链接,包括商业、政治、科技、个人、教育、综合、法律、娱乐、世界、地区、运动、艺术、图书、健康、科学。
Blogory没有提供博客高级搜索,但其具有独特的个性化适应性RSS聚合功能,基于用户的兴趣或其他已经越多的博客自动为用户寻找适当的博客。
Gigablast 博客搜索(http://blogs.gigablast.com/)
Gigablast是一个网络搜索引擎,同时提供博客搜索。虽然博客搜索还处于测试版,但搜索结果质量较之其他博客搜索引擎有过之而无不及。Gigablast没有为各个搜索选项分别设置高级搜索页面,但利用共用的高级搜索页面也能够很好地精确搜索结果。
Gigablast还提供XML搜索服务,基于Gigablast搜索结果创建自己的聚合。虽然此功能稍显多余,但对于希望跟踪Gigablast搜索结果的用户还说,还是值得一用。 Gigablast 还提供其他搜索选项,其中网页索引量达到2,068,530,608,博客索引量达到27,086,736个网页,旅游搜索量达到5,420,820个网页,政府搜索量达到34,367,200个网页。Gigablast除了网页和目录搜索外,其他搜索功能均为测试阶段。
IceRocket博客搜索(http://www.icerocket.com/?tab=blog)
与Gigablast类似,IceRocket也提供多种搜索选项,包括网页搜索、新闻搜索、手机图片搜索、图片搜索、多媒体搜索。IceRocket博客高级搜索页面提供有基本的布尔算子搜索和时间区间过滤搜索,并提供有独特的按作者搜索功能。
IceRocket最近宣布将名称改为BlogScour,但未透露是否保留其他搜索选项。
PubSub(http://www.pubsub.com)
本文所列的所有博客和聚合搜索工具中,PubSub显得较为独特。
第一,PubSub不提供直接搜索。用户必须首先为某个自己感兴趣的关键字创建订阅,然后PubSub将把随时找到的相匹配的最新内容通过预警方式通知用户。预警方式包括电子邮件、SMS、PDA/移动设备及即时通讯工具等。
PubSub的第二个独特之处在于,它是一款“实时”搜索工具。也就是说,当新内容被发布到网络后,用户几乎马上就能得到预警通知,第一时间获得这些信息。
目前,PubSub的存储量超过1600万博客,50,000多个互联网新闻组及所有SEC美国证监会(EDGAR,电子数据集中与报告系统)文件。
Technorati (http://www.technorati.com)
Technorati提供有网络搜索、标签搜索和博客搜索,并允许用户分别按关键字、URL或标签进行搜索。在Technorati的统一搜索页面上,集合了所有搜索方式,用户只要在恰当的搜索框内输入不同格式的搜索请求,就能获得相匹配的搜索结果。
Technorati网络搜索当前可跟踪1,680万网站和15亿链接;标签搜索可跟踪实时更新的200万个网络标签;博客搜索目前还是测试版,实际是Technorati按照主题组织的博客目录。
此外,Technorati的流行列表也值得一看。在这里,Technorat按照新闻、书籍、电影、Top 100博客等,展示了网上用户当前关注的各种热门话题。流行列表中的所有资源都保持实时更新状态。
主流搜索引擎与RSS
大量小型但专业的RSS搜索引擎涌现的同时,主流搜索引擎又在作何打算呢?尽管这些主流引擎都在窥觑RSS搜索,但目前还未有任何一家推出较为成熟的RSS搜索服务。
|. Ask Jeeves已经通过旗下Bloglines推出RSS搜索服务,并承认RSS为其重要发展项目之一。但Bloglines是否继续拓展,集成类似于 Teoma的强大搜索能力,还是Ask公司继续Bloglines现有的RSS搜索能力仍未为可知。最大的可能性是以其他补充功能来增强这两种服务。
||. Google没有为RSS聚合内容开通独立搜索入口,但自从Google推出可定制个性化首页之后,Google用户就可以通过“创建新的板块” (create a new section)链接,发现寻找聚合内容的搜索框。此外,用户还可以在任意Google搜索框内,使用“filetype:rss”及 “filetype:xml”命令过滤聚合信息。最新推出的Google Desktop 2桌面搜索第二代还增加了专门针对RSS聚合内容的自动搜索功能。...