目前百度spider抓取新鏈接的途徑有兩個,一是主動出擊發(fā)現(xiàn)抓取,二就是從搜索資源平臺的鏈接提交工具中獲取數(shù)據(jù),其中通過主動推送功能“收”上來的數(shù)據(jù)最受百度spider的歡迎。
對于站長來說,如果鏈接很長時間不被收錄,建議嘗試使用主動推送功能,尤其是新網(wǎng)站,主動推送首頁數(shù)據(jù),有利于內(nèi)頁數(shù)據(jù)的抓取。
那么一些人要問了,為什么提交數(shù)據(jù)之后一直在線上看不到展現(xiàn)呢?其中涉及的因素包括很多方面,在spider抓取這個環(huán)節(jié),影響線上展現(xiàn)的因素有:
1►
網(wǎng)站封禁
如果一邊封禁著百度蜘蛛,一邊向百度提交數(shù)據(jù),那么鏈接是無法成功收錄和展現(xiàn)的。所以建議開發(fā)者及時解除封禁百度蜘蛛。
2 ►
質(zhì)量篩選
百度spider進入3.0后,對低質(zhì)內(nèi)容的識別更加嚴格,尤其是時效性內(nèi)容,從抓取這個環(huán)節(jié)開始進行質(zhì)量評估篩選,過濾掉大量過度優(yōu)化等頁面,低質(zhì)網(wǎng)頁相比之前明顯下降。
3 ►
抓取失敗
抓取失敗的原因很多,比如在辦公室訪問沒有問題,百度spider卻無法正常抓取訪問。所以站點要隨時注意在不同時間地點保證網(wǎng)站的穩(wěn)定性。
4 ►
網(wǎng)站安全
如果站點頁面數(shù)量突然爆發(fā)式增長,會影響到優(yōu)質(zhì)鏈接的抓取收錄。所以站點在保證訪問穩(wěn)定外,也要關(guān)注網(wǎng)站安全,防止被黑注入。