有很多原因導致相同的的內容刊登在不同網站,重複內容有機會令搜尋結果顯示相同資訊,令搜尋結果的質數下降。為避免這情況發生,Google 表示會採取不收錄重複內容網頁的措施。當然現實之中,大家都經常可發現重複內容的網頁出現在搜尋結果內,尤以國內網站為甚。或者可以理解為 Google 未算做得太徹底。不過作為內容的原作者,一定不希望自己的網站不被收錄,不應把重複內容的問題掉以輕心。
站內和誇站重複內容
重複內容的網頁可分為站內和誇網站兩大類,前者大多是由於製作網站時的疏忽或內容管理系統的設定不當,導致不同URL顯示同一內容,Google 網站管理員說明中心很詳細介紹減少站內重複內容的方法。在以上網頁中有一小段其實是關於誇站重複內容的,若你一不留神,可能錯過了 「審慎的聯合顯示」這一點 (老實說翻譯得太差,香港人一定看不明白)。這小小一段文字其實才是重複內容最受網站製作者和 SEOers 關注的地方。
誇站重複內容的成因
為什麼不同網站會刊登相同內容呢?原因有幾個:
- 原作者把內容轉發到其他網站或論壇,以增加閱讀率或作推廣宣傳之用
- social bookmark / 網誌聯播等服務,特別是中文網站的服務,不少以自己網域的URL來顯示其他網站的內容,例如 365Bloglink
- 網站參加了 blog network,自動供稿 (這就是「聯合顯示」)
- 不問自取你的網站內容,國內稱這行為「採集」,這是國內網站經常出現相同內容的主因
如何令 Google 相信你是原作者?
誇站重複內容最大問題是 Google 有機會不能分辨誰是原作者,結果原作的網站反而不被收錄。因此解決的方法就是使搜尋器知道你是原作者。Google 官方 blog 提議我們參考 《Ranking As The Original Source For Content You Syndicate》一文。其實最重要而自己可以控制的一點,就是在自己的原文中加入這網頁的 URL。
加入原文的URL
最簡單的方法,就是在原文的網頁上加入這網頁的自我連結 (例如在結尾加入)。有些網站採用這方法,但如果你覺得這方法不好看,就要謹記以下的方法:
- 當你手動把內容轉發到其他網站或論壇,請記得在文中加上這原文的 URL
- 一般 social bookmark、網誌聯絡、blog network 和部分採集網都是讀取網站的 RSS Feed 取得你的網站內容,因此你可以只在 RSS Feed 加入原文的網址,Wordpress 用家可使用 RSS 相關的插件,例如 Better Feed 和 RSS Footer。Feedburner 用戶則可使用 Feedflare 做到相同的效果。
另一些自保方法
上述的方法不能阻擋刻意偷取內容的網站,採集網站一般以程式讀取網頁的內容,加工減料去除原文網址。因此我建議大家製作了新內容後,應該盡快通知搜尋器,希望可以第一時間收錄你的網頁資料。網誌通常都有 Ping 的功能,可以即時通知搜尋器。而如果你的網站不是 blog,則應該盡快更新你的 sitemap,及用搜尋器的站長工具,通知他們你的網站更新了,詳細方法可參考 《把網站加入到 Yahoo 及 Google 的方法 (三)》。



留言
寫下留言