用慣CMS的朋友都知道,CMS都有采集功能,同是地網(wǎng)站做的得了又擔(dān)憂別人會(huì)采集你網(wǎng)站的內(nèi)容,以保來(lái)防止別人采集呢,以下有三種方法來(lái)解決這問題:
1、隨機(jī)模版
你可以多復(fù)制N多模版,在body內(nèi)容標(biāo)記附近稍微修改一下。你每次變換模板時(shí),別人再按以前規(guī)則采集時(shí)就可采不到內(nèi)容,只要你的模版夠多,人家就失去耐性,放過(guò)你了。
缺點(diǎn):就是要復(fù)制N多模版,麻煩
2、防采集字符混淆
在body表示是插入大量混淆字符別人采集也一并把混淆字符采集過(guò)去了。
缺點(diǎn):有可能對(duì)SEO造成影響,對(duì)于圖片站來(lái)說(shuō),假如別人不在乎你的混淆字符的話,人家照樣采集,別人下載你的圖片給你帶來(lái)過(guò)大的流量。
3、還有一個(gè)好的解決辦法(推薦)
在body標(biāo)記附近的<div class=”abc”>修改成<div class=”abc {dede:field.id/}”>,注意是空格+{dede:field.id/},這樣div的class還是沒有變,但產(chǎn)生了<div class=”abc 文檔ID”>,或者在html標(biāo)記里插入id={dede:field.id/},比如<div id={dede:field.id/}> <body id={dede:field.id/}>注意如果當(dāng)前的html標(biāo)記有存在的ID最好不要再插入了。
讓采集者寫規(guī)則的時(shí)候沒辦法找到相同的,他就沒辦法寫了,如果他連<div class=”abc 文檔ID”>也采集進(jìn)去的話,你就在<div class=”abc 文檔ID”>前面的有class的地方照樣這樣做。
當(dāng)然,別人可以使用過(guò)濾規(guī)則來(lái)去掉,但是假如我在所有的class里插入文檔ID,或者插入id=文檔ID這樣的。那他就采集整個(gè)頁(yè)面然后再過(guò)濾吧。
缺點(diǎn):如果插入{dede:field.id/}不夠多的話別人可以用過(guò)濾規(guī)則過(guò)濾掉。