?百度曾在站長(cháng)貼吧里做過(guò)這樣一個(gè)回復
從用戶(hù)體驗角度,“有些轉載未必比原創(chuàng )差”
比方一篇科技原創(chuàng )博文,被知名門(mén)戶(hù)網(wǎng)站的科技頻道轉載
如果這種轉載保留原創(chuàng )者姓名和出處鏈接,實(shí)際上對原創(chuàng )者是有利的,因為起到了更好的傳播效果
只是國內的轉載,很多是掐頭去尾,使原創(chuàng )者比較受傷
據資料表明近似重復網(wǎng)頁(yè)的數量占網(wǎng)頁(yè)總數的的比較高達全部頁(yè)面的29%,而完全相同的頁(yè)面大約占全部頁(yè)面的22%
很多站長(cháng)都會(huì )抱怨,自己寫(xiě)的文章被轉載后要么排名消失、要么轉載站排在前面,比如下圖
搜索引擎是怎么刪除重復網(wǎng)頁(yè)的 seo優(yōu)化 搜索引擎 SEO推廣 第1張在解決這個(gè)問(wèn)題之前,我認為有必要了解下搜索引擎的“去重算法框架”,換個(gè)角度看看搜索引擎是怎么給網(wǎng)頁(yè)去重的
你的網(wǎng)頁(yè)什么時(shí)候會(huì )被刪除?因為互聯(lián)網(wǎng)上有大約22%的內容是相同的,一旦你的文章發(fā)表在網(wǎng)上,就有可能會(huì )被轉載,而一般判斷幫你的網(wǎng)頁(yè)為轉載,那么搜索引擎一般會(huì )從三個(gè)時(shí)間段來(lái)刪除你的網(wǎng)頁(yè)
(1)抓取頁(yè)面的時(shí)候刪除,這樣可以減少搜索引擎帶寬以及減少存儲數量;(2)收錄之后刪除重復網(wǎng)頁(yè);(3)用戶(hù)檢索時(shí)候進(jìn)行再次刪除;增加準確性,耗費時(shí)間;內容重復的4種類(lèi)型:1.如果2篇文章內容和格式上毫無(wú)差別,則這種重復叫做“完全重復頁(yè)面”2.如果2篇文章內容相同,但是格式不同,則叫做“內容重復頁(yè)面”3.如果2篇文章有部分重要的內容相同,并且格式相同,則稱(chēng)為“布局重復頁(yè)面”4.如果2篇文章有部分重要的內容相同,但是格式不同,則稱(chēng)為“部分重復頁(yè)面”刪除重復網(wǎng)頁(yè)對于搜索引擎有很多好處:1.如果這些重復網(wǎng)頁(yè)并從搜索引擎數據庫中去掉,就能節省一部分存儲空間,提高檢索的質(zhì)量
2.為了提高網(wǎng)頁(yè)的搜集速度,搜索引擎會(huì )對以往搜集信息的分析,預先發(fā)現重復網(wǎng)頁(yè),在今后的網(wǎng)頁(yè)搜集過(guò)程中就可以避開(kāi)這些網(wǎng)頁(yè),這就是為什么總轉載的網(wǎng)站排名不高的原因了
3.對某個(gè)鏡像度較高的網(wǎng)頁(yè),搜索引擎會(huì )賦予它較高的優(yōu)先級,當用戶(hù)搜索時(shí)就會(huì )賦予它較高的權重
4. 近似鏡像網(wǎng)頁(yè)的及時(shí)發(fā)現有利于改善搜索引擎系統的服務(wù)質(zhì)量,也就是說(shuō)如果用戶(hù)點(diǎn)擊了一個(gè)死鏈接,那么可以將用戶(hù)引導到一個(gè)相同頁(yè)面,這樣可以有效的增加用戶(hù)的檢索體驗
通用去重算法框架對于網(wǎng)頁(yè)去重任務(wù),具體可以采取的技術(shù)手段五花八門(mén),各有創(chuàng )新和特色,但是如果仔細研究,其實(shí)大致都差不多
搜索引擎是怎么刪除重復網(wǎng)頁(yè)的 SEO優(yōu)化 搜索引擎 SEO推廣 第2張上圖給出了通用算法框架的流程圖,對于給定的文檔,首先要通過(guò)一定特抽取手段,從文檔中抽取出一系列能夠表征文檔主題內容的特征集合
這一步驟往往有其內在要求,即盡可能保留文檔重要信息,刪除無(wú)關(guān)信息
之所以要刪除部分信息,主要是從計算速度的角度考慮,一般來(lái)說(shuō),刪除的信息越多,計算速度會(huì )越快
這就是為什么你想做的關(guān)鍵字總沒(méi)有排名,反而不想做的關(guān)鍵詞卻能排名靠前的原因之一,搜索引擎把它認為不重要的詞語(yǔ)刪除了
來(lái)源
盧松松博客
請立即點(diǎn)擊咨詢(xún)我們或撥打咨詢(xún)熱線(xiàn): 18942620423,我們會(huì )詳細為你一一解答你心中的疑難。項目經(jīng)理在線(xiàn)