- 相關(guān)推薦
避免蜘蛛陷阱的技巧
“蜘蛛陷阱”是阻止蜘蛛程序爬行網(wǎng)站的障礙物,雖然網(wǎng)頁(yè)界面看起來(lái)非常正常,但這些蜘蛛陷阱會(huì)對(duì)蜘蛛程序造成障礙。哪些做法不利于蜘蛛爬行和抓取呢?怎么去避免這些蜘蛛陷阱呢?下面隨小編來(lái)了解一下!
1、 登錄要求
有些企業(yè)站和個(gè)人站設(shè)置一定要用戶(hù)注冊(cè)登錄后,才能看到相關(guān)的文章內(nèi)容,這種對(duì)蜘蛛不是很友好,因?yàn)橹┲霟o(wú)法提交注冊(cè),更無(wú)法輸入用戶(hù)名和密碼登錄查看內(nèi)容。對(duì)于蜘蛛來(lái)說(shuō),用戶(hù)直接點(diǎn)擊查看到的內(nèi)容也是蜘蛛所能看到的內(nèi)容。如果你的網(wǎng)站有這種情況,請(qǐng)取消這一功能,但網(wǎng)站如果有VIP用戶(hù)或部分資源,是可以這樣設(shè)置的。
2、動(dòng)態(tài)URL
動(dòng)態(tài)URL可以簡(jiǎn)單理解為在URL中加入過(guò)多的符號(hào)或者網(wǎng)址參數(shù),雖然隨著搜索引擎的技術(shù)發(fā)展,動(dòng)態(tài)URL對(duì)于蜘蛛的抓取已經(jīng)越來(lái)越不是問(wèn)題了,但是從搜索引擎友好度上講,靜態(tài)哪陷是偽靜態(tài)相對(duì)來(lái)說(shuō)都比動(dòng)態(tài)URL要好。URL優(yōu)化將在本章第6節(jié)中討論。 /
3、強(qiáng)制用Cookies
強(qiáng)制用Cookies對(duì)于搜索引擎來(lái)說(shuō)相當(dāng)于直接禁用了Cookies,而有些網(wǎng)站為了實(shí)現(xiàn)某些功能。會(huì)采取強(qiáng)制Cookies,例如跟蹤用戶(hù)訪(fǎng)問(wèn)路徑,記住用戶(hù)信息,甚至是盜取用戶(hù)隱私等,如果用戶(hù)訪(fǎng)問(wèn)這類(lèi)站點(diǎn)時(shí)沒(méi)有啟用Cookies,所顯示的頁(yè)面就會(huì)不正常。所以,對(duì)于蜘蛛來(lái)講,同樣的網(wǎng)頁(yè)無(wú)法正常訪(fǎng)問(wèn)。
4、 框架結(jié)構(gòu)
早期框架網(wǎng)頁(yè)到處被泛濫使用,而現(xiàn)在很多網(wǎng)站已經(jīng)很少使用了,一是因?yàn)楝F(xiàn)在隨著各大CMS系統(tǒng)的開(kāi)發(fā)問(wèn)世,網(wǎng)站維護(hù)相對(duì)越來(lái)越簡(jiǎn)單了,早期網(wǎng)站使用框架是因?yàn)閷?duì)網(wǎng)站頁(yè)面的維護(hù)有一定的便利性,現(xiàn)在已經(jīng)大可不必了,而且不利于搜索引擎收錄也是框架越來(lái)越少被使用的原因之一。
5、各種跳轉(zhuǎn)
對(duì)搜索引擎來(lái)說(shuō),只對(duì)301跳轉(zhuǎn)相對(duì)來(lái)說(shuō)比較友好,對(duì)其他形式的跳轉(zhuǎn)都比較敏感。如JavaScritp跳轉(zhuǎn)、MetaRefresh跳轉(zhuǎn)、Flash跳轉(zhuǎn)、302跳轉(zhuǎn)。
有些網(wǎng)站的做法很讓人無(wú)奈,當(dāng)打開(kāi)網(wǎng)頁(yè)后,會(huì)自動(dòng)轉(zhuǎn)向其他頁(yè)面,如果打開(kāi)的頁(yè)面和你要找的頁(yè)面豐體相關(guān).+掃.笪討很去,佃是很大部分的網(wǎng)站轉(zhuǎn)向讓你無(wú)任何理由和目的,這種轉(zhuǎn)向不推薦大家使用,如果非要做轉(zhuǎn)向,只推薦用301永久跳轉(zhuǎn),可以將權(quán)重進(jìn)行傳遞,除此轉(zhuǎn)向其他都不推薦,因?yàn)楹芏嗥渌D(zhuǎn)向欺騙用戶(hù)和搜索引擎,也是黑帽的一種手段,建議大家不要使用。
6、JavaScript跳轉(zhuǎn)
雖然現(xiàn)在搜索引擎對(duì)于JavaScript里的鏈接可以跟蹤,甚至嘗試拆解分析,但是我們最好不要寄望于搜索引擎自己克服困難。雖然通過(guò)JavaScript可以做一些效果不錯(cuò)的導(dǎo)航,但是CSS同樣也可以做到。為了提高網(wǎng)站對(duì)搜索引擎的友好度,使網(wǎng)頁(yè)能夠更好地蜘蛛爬行,盡量不要采用JavaScript當(dāng)然,在SEO中,JavaScript有一個(gè)好處就是站長(zhǎng)不希望被收錄的頁(yè)面或者友情鏈接可以采用JavaSc:npt。當(dāng)然,有一種方法可以消除JavaScript蜘蛛程序陷阱,即使用
7、Flash
有的網(wǎng)站頁(yè)面使用Flash視覺(jué)效果是很正常的,例如用Flash做的Logo、廣告、圖表等,這些對(duì)搜索引擎抓取和收錄是沒(méi)有問(wèn)題的,但很多網(wǎng)站的首頁(yè)是一個(gè)大的Flash文件,這種就叫蜘蛛陷阱。在蜘蛛抓取時(shí),HTML代碼中只是一個(gè)鏈接,并沒(méi)有文字,雖然大的Flash效果看上去很好,外觀(guān)看著也很漂亮,但可惜搜素引擎看不到,無(wú)法讀取任何內(nèi)容,所以,為了能體現(xiàn)網(wǎng)站優(yōu)化的最好效果,不提倡這種Flash作為首頁(yè)圖片。
8、采用session id的頁(yè)面
有的銷(xiāo)售類(lèi)站點(diǎn)為了分析用戶(hù)的某些信息,會(huì)采用會(huì)話(huà)ID來(lái)跟蹤用戶(hù)。訪(fǎng)問(wèn)站點(diǎn)時(shí),每個(gè)用戶(hù)訪(fǎng)問(wèn)都會(huì)增加一次:?ssion id而加人到URL中。同樣,蜘蛛的每一次訪(fǎng)問(wèn)也會(huì)被當(dāng)作一個(gè)新用戶(hù)。每次蜘蛛訪(fǎng)問(wèn)的URL中都會(huì)加入一個(gè)。Ession id,產(chǎn)生同一個(gè)頁(yè)面但URL不同的情況,這種情況會(huì)產(chǎn)生復(fù)制內(nèi)容頁(yè)面,造成高度重復(fù)的內(nèi)容頁(yè),同時(shí)也是最常見(jiàn)的蜘蛛陷阱之一。
【避免蜘蛛陷阱的技巧】相關(guān)文章:
如何避免蜘蛛陷阱06-14
網(wǎng)站優(yōu)化常見(jiàn)蜘蛛陷阱分析08-25
導(dǎo)演要避免的十大制作陷阱10-18
健身避免受傷的技巧11-12
避免追尾的剎車(chē)技巧07-28
避免80%的車(chē)禍的駕駛技巧10-15
2016避免被追尾的的駕駛技巧09-30