本篇文章2102字,讀完約5分鐘
一、死鏈介紹
1、什么是死鏈
幾乎所有的網(wǎng)站或智能小程序都會遇到內(nèi)容失效、過期,頁面不需要再展現(xiàn)的情況,這些無法對用戶提供任何有價(jià)值信息的頁面就是死鏈接,它包括協(xié)議死鏈和內(nèi)容死鏈兩種形式。
2、為什么要及時(shí)處理死鏈
當(dāng)站點(diǎn)/小程序死鏈數(shù)據(jù)累積過多并且被展示到搜索結(jié)果頁時(shí),會影響百度搜索對站點(diǎn)/小程序的評價(jià),對站點(diǎn)/小程序的訪問體驗(yàn)和用戶轉(zhuǎn)化都會起到負(fù)面影響。另一方面,百度檢查死鏈的流程也會為站點(diǎn)/小程序帶來額外負(fù)擔(dān),影響對其他正常頁面的抓取和索引。
二、百度搜索建議的死鏈類型及設(shè)置方案
常見的死鏈包括協(xié)議死鏈(百度搜索建議的死鏈類型)和內(nèi)容死鏈,還有一些對百度并不友好的“個(gè)性化死鏈”。
協(xié)議死鏈:頁面的TCP協(xié)議狀態(tài)/HTTP協(xié)議狀態(tài)明確表示的死鏈,常見的如404、410。
內(nèi)容死鏈:服務(wù)器返回狀態(tài)是正常的,但內(nèi)容已經(jīng)變更為不存在、已刪除或需要權(quán)限等與原內(nèi)容無關(guān)的信息頁面。
在此,百度搜索建議的死鏈設(shè)置方案為:
第一步,將返回碼設(shè)置為404或者410:如果站點(diǎn)/小程序已永久刪除相應(yīng)內(nèi)容,并且不打算對內(nèi)容進(jìn)行替換,建議開發(fā)者將返回碼設(shè)置成404或410,百度爬蟲嘗試抓取網(wǎng)頁時(shí),如果返回碼為404或410,會將URL判定為死鏈,進(jìn)而從搜索中刪除
第二步,設(shè)置完返回碼后,修改頁面標(biāo)題,明確表示該頁面為死鏈,頁面內(nèi)容可以進(jìn)行個(gè)性化設(shè)置。
對百度搜索不友好的死鏈類型及不推薦的死鏈方案:
1、個(gè)性化死鏈
部分開發(fā)者追求個(gè)性化和用戶體驗(yàn),在頁面內(nèi)容失效后并未做協(xié)議死鏈處理,也就是說返回狀態(tài)碼依然是200,僅僅是在頁面上做了一個(gè)有趣的個(gè)性化圖片,通過圖片告訴用戶這個(gè)頁面沒有有價(jià)值的內(nèi)容,這類死鏈?zhǔn)前俣人阉鞑惶岢摹?
2、頁面內(nèi)容為死鏈但是返回碼為200
3、頁面重定向到首頁、錯(cuò)誤頁面、登錄頁面
例如:頁面A內(nèi)容已經(jīng)失效,用戶點(diǎn)擊頁面后,頁面跳轉(zhuǎn)到了站點(diǎn)首頁。
不推薦的死鏈設(shè)置方案可能會使搜索引擎造成混淆,使得站點(diǎn)的無效內(nèi)容在搜索結(jié)果中展現(xiàn),最終影響站點(diǎn)的排名和評價(jià)。
三、如何處理死鏈
【站點(diǎn)】
第一步,篩查站點(diǎn)內(nèi)部存在的死鏈,制作死鏈文件,并將這些死鏈頁面設(shè)置成為404頁面,即百度訪問它們時(shí)返回碼為404。
第二步,將死鏈文件放置在網(wǎng)站根目錄下
比如您的網(wǎng)站為example.com,您已制作了一個(gè)silian_example.xml死鏈文件,則將silian_example.xml上傳至網(wǎng)站根目錄即example.com/silian_example.xml。
第三步,登錄百度搜索資源平臺-死鏈提交工具提交死鏈數(shù)據(jù)
(1)通過搜索資源平臺-搜索服務(wù)-資源提交-死鏈提交,到達(dá)操作頁面;
(2)填寫死鏈文件更新周期,可選“每隔xx小時(shí)/天更新一次”;
(3)填寫死鏈文件地址,請留意提交框右側(cè)的配額提示;
(4)管理已提交的死鏈列表,可查看死鏈文件狀態(tài)和死鏈處理狀態(tài)。
特別提醒:
1、在提交死鏈時(shí),要保證所有頁面都處于404狀態(tài),提交文件中請勿包括活鏈URL,如有活鏈會導(dǎo)致活鏈URL從搜索中移除。
2、索引型死鏈Sitemap文件工具將不予處理,請勿提交索引型死鏈Sitemap文件。
【小程序】
整理出需要?jiǎng)h除的資源path路徑,通過智能小程序開發(fā)者平臺-自然搜索-資源刪除工具進(jìn)行提交。
特別提醒:
1、死鏈文件每?一條path路徑,?件支持txt格式,每個(gè)文件最多允許1000個(gè)path路徑,且需小于10MB;
2、為避免誤刪除影響小程序已有流量,每天最多可提交一次死鏈文件。
附錄:
常見的死鏈返回碼:
404 Not Found,表示服務(wù)器沒有找到任何匹配請求URL的東西,沒有說明這種情況是暫時(shí)的還是永久的。
410 Gone,表示請求的內(nèi)容在服務(wù)器上不再可用,且沒有已知的轉(zhuǎn)發(fā)地址。410通常表示資源永久性的失效。
正常頁面返回碼:
200 OK,表示請求成功。
如果相關(guān)內(nèi)容已刪除或移動(dòng),不建議返回成功狀態(tài)碼(200 OK)而是返回404、410狀態(tài)碼。
204 NoContent,表示這個(gè)請求沒有要發(fā)送的內(nèi)容,但是報(bào)頭可能有用。用戶代理可以使用新的報(bào)頭來更新此資源的緩存頭。
如果頁面已經(jīng)刪除,請返回404/410,返回204可能給搜索引擎造成混淆。
其他返回碼:
如果正常頁面長期返回非2xx、3xx的錯(cuò)誤碼,可能會影響相應(yīng)內(nèi)容的收錄和搜索展現(xiàn)。常見的錯(cuò)誤碼如下:
403 Forbidden,表示客戶端沒有獲取內(nèi)容的權(quán)限。
429 Too ManyRequests,表示用戶在給定時(shí)間內(nèi)發(fā)送了太多的請求。
500 Internal ServerError,表示服務(wù)器遇到了不知道如何處理的情況。
503 ServiceUnavailable,表示服務(wù)器還沒有準(zhǔn)備好處理請求。通常的情況是服務(wù)器超載或者正在維護(hù)。
如果由于抓取頻次過高導(dǎo)致429、5xx錯(cuò)誤,開發(fā)者可以在百度搜索資源-抓取頻次-抓取頻次上限調(diào)整頁面對百度爬蟲的抓取頻次進(jìn)行設(shè)置。
本文鏈接:http://www.cjzzc.com/article/1268.html
標(biāo)題:【網(wǎng)站優(yōu)化必看】網(wǎng)站死鏈介紹及設(shè)置方法
地址:http://www.mawius.com//xwdt/43880.html