RSS技術最初的用處是:為站點與其他站點之間共享內容,建立的一種簡易方式(也叫聚合內容),通常被用于新聞和其他按順序排列的網站,例如Blog。RSS技術也為普通的網民提供了一種新型的信息獲取方式,通過在客戶端的機器上安裝一個“RSS閱讀器”,您就可以通過這個閱讀器訂閱您所關心的網站中的最新內容。本文所要介紹的是關于RSS的另一方面的應用技術——網站如何通過RSS技術獲取其他網站的信息資源。
一、網站采集信息的主要方法介紹
提供信息是各個網站最主要的功能,而只有最大限度地獲取信息,才能夠為用戶提供最有價值的信息,因此網站的基本運作模式應該是:
獲取信息——加工、篩選、分類、聚合信息——輸出信息
網站之間互通有無、共享信息,是解決網站信息來源的主要方法之一。一般有以下手段可以實現:
1、 通過人工方式有選擇地轉載其他網站的文章、圖片等,或者建立超級鏈接指向其他網站的相關信息;
2、 通過“新聞采集”技術,自動獲取其他網站的全部頁面內容,經程序的適當加工處理后,輸出給瀏覽者。由于這種技術,可以替換LOGO、網站標題、署名、廣告等信息,偷梁換柱,完全改變原始信息的頁面外觀結構,看上去酷似一個新的網站。因此也稱為“新聞小偷”;
3、 通過RSS技術,聚合其他網站的相關內容,輸出給瀏覽者。
方法1簡便易行,但工作效率太低;方法2曾經流行過一段時間,尤其是***編寫的“新浪新聞小偷”asp程序模塊,被許多網站采用,但它既然被冠以了“小偷”之名,顯然就不適合正人君子所用;本人認為:這種“新聞小偷”程序不僅僅是涉及了版權問題,而且還制造了大量的網絡信息垃圾,由于它只是簡單地全盤盜用了別的網站信息,沒有經過信息的篩選、過濾、整理、歸類等加工,沒有產生新的有用的信息成分。
二、網站通過RSS技術聚合信息
通過RSS技術的信息聚合,不同于“新聞小偷”,首先,RSS信息由信息原作者提供,其用途就是給其他網站共享,而且RSS信息中,只包含信息的標題、鏈接、作者、摘要等,并未包含全部的細節內容,版權相對明晰;其二,RSS使用了規范的XML文本格式,信息的傳遞、接收處理都非常方便,占用很少的資源;其三,RSS信息本身就具有很好的分類特性,很容易就可以將不同網站的同類信息聚合在一起。因此通過RSS共享,必將成為網站之間信息交流的主要模式。
作為RSS信息聚合技術的一種應用嘗試,我們用ASP設計了一個基于Web的RSS信息聚合程序,并且應用在E道理電子技術交流網中,開辟了[科技新聞]欄目。
欄目主要功能如下:
1、提供了RSS信息轉化成為HTML信息的功能,直接在頁面上點擊媒體鏈接,就可以立即獲得最新信息的HTML頁面顯示;
2、提供了自助添加RSS鏈接的功能,瀏覽者如果發現好的RSS頻道,可以直接通過頁面以表單方式提交,并添加到頁面上的RSS鏈接列表中,供大家分享,您也可以將您自己網站上的RSS鏈接推薦到這個欄目中;
3、目前上面已經建立了一些主要媒體的RSS信息鏈接,主要限于科技類信息,供網友們使用,也歡迎您添加其他頻道信息。