為減少重複內容而設的 Canonical Link Tag

三大搜尋引擎 Google、Microsoft Live Search 和 Yahoo! 難得地攜手合作,共同支援在網頁內加入 Canonical Link Tag (國內翻譯為權威鏈接標記),務求減少重複內容引起的問題,對搜尋引擎本身、搜尋引擎用戶及網站三方面都有好處。搜尋引擎可減少收錄不必要的網頁,而網站亦不必怕所謂 Duplicate Content Punishment (雖然個人則一直認為部分網站過份擔心)。

印象中三巨頭較一致性的行動是支援 “nofollow” 打擊 SPAM Comment 的問題,因此可以估計收錄重複內容是 Search Engine 面對的一個大問題,比一般人想像更嚴重。

為什麼網站會有重複內容呢?並非網站製作者有意或無意地把相同的內容放在不同網頁,而是由於不少網站內容都由系統製作,系統根據輸入的參數 (包括由網址傳遞的參數) ,在資料庫讀取資料創製網頁。在這情況下,有機會讓一個相同的網頁有不同的網址。相信大家都有玩過論壇吧,Discuz 一個 Post 的網址可以是:

http://www.anyforum.com/redirect.php?tid=2219&goto=lastpost#lastpost

http://www.anyforum.com/viewthread.php?tid=2219&extra=page%3D1&page=3

而一些系統在網址上更加上 session id、printed version 標記 (用來使用不同的 css)、tracking id (例如 rss feed 的 link 內會加入 from_rss)、可有可無的 category / sub-category id 等參數,令網頁的 URL 有不同的版本。搜尋引擎雖然已變得越來越聰明,但始終難以準確無誤地決定在搜尋結果上顯示那一個 URL。

Canonical Link Tage 的用途,則是讓網站製作人員自行告訴搜尋引擎應該收錄的 URL。只要在網頁的 meta tag 中增加以一行:<link rel=”canonical” href=”preferred url” /> ,搜尋器便不需要靠估了。因此對網站而言,Canonical Link Tag 最大的好處是可防止不必要的參數放在網址上,令搜尋結果看來更簡潔,也減少由一個用家傳給另一個用家時出錯的機會。

Canonical Link Tag 的目的是減少在同一網站上,因網址有不同版本而引起的重複內容的問題,這 Tag 並不可以用來解決因網頁內容透過不同途徑發表,或者被人抄襲而起的問題,關於後者可參看如何減低重複內容對網站收錄的影響

如果閣下的網站由流行的網站系統建立,相信很快便可使用這一新功能了。

三大搜尋引擎的公告:

Specify your canonical

Partnering to help solve duplicate content issues

Fighting Duplication: Adding more arrows to your quiver

分享:

歡迎發表回應或 訂閱本站網誌

留言

未有留言

寫下留言

(必須)

(必須,不會顯示)