RSS技术最初的用处是:为站点与其他站点之间共享内容,建立的一种简易方式(也叫聚合内容),通常被用于新闻和其他按顺序排列的网站,例如Blog。RSS技术也为普通的网民提供了一种新型的信息获取方式,通过在客户端的机器上安装一个“RSS阅读器”,您就可以通过这个阅读器订阅您所关心的网站中的最新内容。本文所要介绍的是关于RSS的另一方面的应用技术——网站如何通过RSS技术获取其他网站的信息资源。
一、网站采集信息的主要方法介绍
提供信息是各个网站最主要的功能,而只有最大限度地获取信息,才能够为用户提供最有价值的信息,因此网站的基本运作模式应该是:
获取信息——加工、筛选、分类、聚合信息——输出信息
网站之间互通有无、共享信息,是解决网站信息来源的主要方法之一。一般有以下手段可以实现:
1、 通过人工方式有选择地转载其他网站的文章、图片等,或者建立超级链接指向其他网站的相关信息;
2、 通过“新闻采集”技术,自动获取其他网站的全部页面内容,经程序的适当加工处理后,输出给浏览者。由于这种技术,可以替换LOGO、网站标题、署名、广告等信息,偷梁换柱,完全改变原始信息的页面外观结构,看上去酷似一个新的网站。因此也称为“新闻小偷”;
3、 通过RSS技术,聚合其他网站的相关内容,输出给浏览者。
方法1简便易行,但工作效率太低;方法2曾经流行过一段时间,尤其是***编写的“新浪新闻小偷”asp程序模块,被许多网站采用,但它既然被冠以了“小偷”之名,显然就不适合正人君子所用;本人认为:这种“新闻小偷”程序不仅仅是涉及了版权问题,而且还制造了大量的网络信息垃圾,由于它只是简单地全盘盗用了别的网站信息,没有经过信息的筛选、过滤、整理、归类等加工,没有产生新的有用的信息成分。
二、网站通过RSS技术聚合信息
通过RSS技术的信息聚合,不同于“新闻小偷”,首先,RSS信息由信息原作者提供,其用途就是给其他网站共享,而且RSS信息中,只包含信息的标题、链接、作者、摘要等,并未包含全部的细节内容,版权相对明晰;其二,RSS使用了规范的XML文本格式,信息的传递、接收处理都非常方便,占用很少的资源;其三,RSS信息本身就具有很好的分类特性,很容易就可以将不同网站的同类信息聚合在一起。因此通过RSS共享,必将成为网站之间信息交流的主要模式。
作为RSS信息聚合技术的一种应用尝试,我们用ASP设计了一个基于Web的RSS信息聚合程序,并且应用在E道理电子技术交流网中,开辟了[科技新闻]栏目。
栏目主要功能如下:
1、提供了RSS信息转化成为HTML信息的功能,直接在页面上点击媒体链接,就可以立即获得最新信息的HTML页面显示;
2、提供了自助添加RSS链接的功能,浏览者如果发现好的RSS频道,可以直接通过页面以表单方式提交,并添加到页面上的RSS链接列表中,供大家分享,您也可以将您自己网站上的RSS链接推荐到这个栏目中;
3、目前上面已经建立了一些主要媒体的RSS信息链接,主要限于科技类信息,供网友们使用,也欢迎您添加其他频道信息。