文章的采集功能是通過程序來遠程獲取目標網頁內容,經過本地規則解析處理后存儲到服務器的數據庫內。
文章采集系統顛覆傳統采集模式和流程,采集規則與采集界面分離,規則設置更簡單,只需有基礎技術知識的人員設置好相關規則。編輯人員無需了解太過細節的技 術規則,只需選中自己想要采集的文章列表,就可以像發布文章一樣,輕松地完成采集操作。
a. 方便而簡潔的采集規則配置
對于需要采集功能的網站來說,簡潔而方便的規則配置是易用性的體現.技術人員只需要很基本的網頁知識就可以隨心地去寫采集規則.在寫規則完成,可以實時地 顯示出采集的內容是否正確.通過此功能可以方便地測試出內容的可用性.
方便而簡潔的采集規則配置
b. 采集規則可永久性使用
對于已經寫好的采集規則,系統會自動添加到規則列表中,以備以后使用。每一規則都可以重復利用,并且可根據需求做出修改。
采集規則可永久性使用
c. 自定義的文章采集數量
根據采集規則的配置參數,可以方便地在采集控制版選取到所需采集文章的數據量。
d. 高效地采集管理界面
自定配置的所有采集規則都會在采集管理界面呈現出來,并且能夠根據采集更新的頻率查找出最新文章,系統通過最新,已查看,已采集標示出文章所處的狀態。管 理人員可以通過采集管理界面選擇性地對需要的文章進行采集。
高效地采集管理界面