重複內容通常是指一或多個網域中,完全或大致與其他同樣語言的內容相符的實質內容區塊。一般而言,重複內容本身並不構成欺騙行為。非惡意的重複內容可能包括:
- 會產生一般網頁和行動裝置專用精簡網頁的論壇
- 在網路商店中,能透過多個不同網址顯示或連結的商品
- 列印專用的網頁
如果網站有許多內容大致相同的網頁,那麼可以透過幾種不同的方式告知 Google 偏好的網址,這項作業稱為「標準化」。
但在某些情況下,有心人士會故意在多個網域中置入重複內容,試圖操控搜尋引擎的排名或贏得更多的流量。這種欺騙行為會讓訪客在多個搜尋結果中看到大致相同的內容,導致使用者體驗大打折扣。
Google 致力於將含有不同資訊的網頁編入索引,並向使用者呈現這些各自擁有獨特內容的網頁。舉例來說,假設您網站的每篇文章都有「普通」和「列印」版本,而且兩者都沒有使用 noindex
標記封鎖,那麼 google 會加以篩選,只在搜尋結果中列出其中一種版本。在極少數情況下,Google 會發現有網站為了操控排名和欺騙使用者而顯示重複內容,針對涉嫌採取這些手段的網站,我們會對其索引和排名做出適當調整。這類調整會造成網站排名降低,或者可能導致網站從 Google 索引中完全移除,而不再出現於搜尋結果中。
可以透過以下幾項步驟主動處理重複內容問題,確保網站能向訪客顯示希望呈現的內容。
- 使用 301 重新導向機制:如果您重新建構了網站,請在 .htaccess 檔案中使用 301 重新導向 (也就是「RedirectPermanent」),即可巧妙地為使用者、Googlebot 和其他自動尋檢程式進行重新導向。在 Apache 中,您可以使用 .htaccess 檔案執行此作業;在 IIS 中,則可以透過管理控制台執行。
- 保持一致:請盡量保持內部連結的一致性。舉例來說,請勿連結至
http://www.example.com/page/
、http://www.example.com/page
和http://www.example.com/page/index.htm
。 - 使用頂層網域:為協助我們將最適當版本的文件提供給使用者,請盡可能使用上層網域來處理國家/地區專屬內容。例如,與
http://www.example.com/de
或http://de.example.com
相比,我們更容易看出http://www.example.de
中含有專為德國提供的內容。 - 謹慎使用聯合發布:如果您以聯合發布方式在其他網站發布內容,在每次相關搜尋中,Google 會一律顯示我們認為最適合使用者的版本,而這不一定是您偏好的版本。不過,我們仍建議您確保在聯合發布內容的每個網站上都有您的原始文章連結。您也可以要求聯合發布內容的採用者在其網站上加入
noindex
標記,以免搜尋引擎為他們的內容版本建立索引。 - 盡量減少一成不變的重複內容:舉例來說,不要在每個網頁下方都放入冗長的版權文字,建議改為提供簡短摘要,並附上詳細資料網頁的連結。此外,可以使用「參數處理」工具來指定 Google 處理網址參數的方式。
- 避免發布不完整的內容:使用者不喜歡看到「空白」網頁,因此請盡可能避免使用預留網頁,例如,請不要發布還沒有實際內容的網頁。如果確實需要建立預留網頁,請使用
noindex
標記加以封鎖,避免 Google 為其建立索引。 - 瞭解您的內容管理系統:請務必熟悉網站顯示內容的方式。網誌、論壇和相關系統通常會以多種格式顯示相同的內容,舉例來說,單篇網誌文章可能會顯示在網誌首頁和封存網頁中,也可能與標籤相同的其他文章出現在同一個網頁上。
- 盡量減少相似內容:如果您有許多相似的網頁,請考慮擴充各網頁的內容,或將其合併成一個網頁。舉例來說,假設您在同個旅遊網站上為兩個城市分別建立網頁,但兩者的內容其實相同,這時候可以將兩者合併為同時介紹兩個城市的單一網頁,或者,您可以擴增兩個網頁的內容,分別介紹兩個城市的特色。
這段因為都是敘述性的,可以查看 google 的原文:
避免建立重複的內容