search
尋找貓咪~QQ 地點 桃園市桃園區 Taoyuan , Taoyuan

網站優化如何避免大量URL被重複收錄(1)

首先聲明,我們只談論有檢索意義的URL,也就是用戶會從搜索引擎查找的頁面。其他頁面按照常用的方法做屏蔽就好了。鑒於很多站長都愛討論整體的收錄量,我必須潑一下冷水,也許你的有效收錄是1/10。

一、URL參數

也叫URL query,是一個最複雜,最容易被忽視,最容易被妥協的問題。他是網站運營中必不可少的元素,如果簡單的去除,其他部門就無法工作了。URL參數經常被用於以下幾方面:

1.同一個實體的不同狀態展示,比如同一個酒店,在不同時間點會有不同的房間庫存。

2.為了統計不同渠道的流量

3.為了統計不同渠道,具體模塊的點擊量

4.調試

5.全世界最奇葩的是亞馬遜,居然把統計參數放到了路徑中

出現這種問題的壞處有幾點:

(1)浪費搜索引擎對你網站的各項配額,從而影響其他正常的頁面。

(2)丟失很多本應拿到的鏈接加分,站外渠道的鏈接往往是最優質的。同一個URL的分值可能分散成幾十份。

(3)SEO的流量被統計到別的渠道(因為tracking欄位寫的是別的渠道,而且被收錄被點擊)。

(4)往往形成一種局面,產品用一套URL,SEO用另一套URL,甚至不同渠道用不同的URL,後期開發和維護的成本極高。

為了解決這個問題,首先要弄清網頁的URL的定義。以我的理解,每一個URL是一個靜態的、獨立不重複的、有意義的實體,一般也有檢索意義(就是有人會搜)。比如一個人,一輛車,一條道路,一個零件。而不能混入各種「狀態」,比如這個人生病的時候,難道就不是他自己了么? 一件商品在促銷的狀態難道是另一件商品了么?

理論上canonical標籤就可以解決這個問題了,但是從實際測試結果看,效果並不明顯,幾乎可以忽略不計。那麼我的解決方案是這樣的:

(1)建立好網站的思維導圖和元信息。

(2)所有和SEO元信息相關的參數都放到路徑中去

(3)所有和SEO元信息不相干的參數都放到#後邊,因為#後邊不影響web伺服器返回的內容。簡單的說就是用」#」替代」?」。

(4)每個頁面中都利用js獲取#後邊的參數對,通過二次請求發回給統計伺服器

(5)如果#後邊的參數影響頁面內容,比如酒店的入住日期。那麼這部分內容用ajax載入就行,他是不穩定的,不屬於頁面內容的一部分。(當然還有變通的辦法,暫不贅述。)

(6)原始的#錨點定義肯定會衝突,定義一個#後邊的變數,並用js控制屏幕滾動,來保證原始錨點的作用。

有人可能會想到,根據ua判斷,如果是搜索引擎爬蟲,就用跳轉的方式去掉URL參數。但效率最高的方法必然是從一開始就不展示錯誤URL。那麼前面的例子優化后就變成了:

其實我們的競爭對手早就使用這種方式了,但是由於我們的開發效率無法及時實現,還沒有趕上行業的進度。所以對於一般的小網站,一定要考慮開發成本,不要輕易冒進。只要能避免問題的發生,變通的方法是很多的。

【版權與免責聲明】如發現內容存在版權問題,煩請提供相關信息發郵件至[email protected],我們將及時溝通與處理。本站內容除非來源註明深圳seo(www.xinxing327.com),否則均為網友轉載,涉及言論、版權與本站無關。



熱門推薦

本文由 yidianzixun 提供 原文連結

寵物協尋 相信 終究能找到回家的路
寫了7763篇文章,獲得2次喜歡
留言回覆
回覆
精彩推薦