站點地圖(英語:Sitemaps,舊稱Google Sitemaps,也寫為Sitemap;又稱網站地圖)是一種列有某個網站所有網址(URL)的XML檔案,由Google最先發起。利用Sitemaps協定,網站管理員可以列出網站上可以供搜尋引擎抓取的URL,並通知給後者。Sitemaps中包含有關每個URL的其他資訊,如URL上次更新的時間、更新的頻率以及相對於網站其他URL的重要性。搜尋引擎的爬蟲可以通過Sitemaps更有效地抓取網站內容,並找到可能與網站其他內容沒有相互連結的URL。Sitemaps協定是對robots.txt
的補充。[1]
歷史
Google於2005年6月宣佈正在進行一項名為Google Sitemaps的實驗,以共享創意許可協定發佈了免費的Sitemaps 0.84,同時發佈了一個Python的開源客戶端Sitemap Generator,用於生成常見的一些Sitemaps。Sitemaps發佈後,即被包括維基媒體基金會下屬站點在內的許多網站採用。2006年11月,Google、雅虎和微軟的Live Search宣佈支援Sitemaps 0.90,Sitemaps成為第一個改進搜尋引擎爬網過程的聯合開放行動。[2][3]Ask.com於2007年4月加入支援Sitemaps的廠商行列[4]。之後,美國亞利桑那州、猶他州、弗吉尼亞州等州的政府陸續宣佈將在其網站上使用Sitemaps[5]。
後來,Sitemaps協定基於打造「對爬蟲友好的Web伺服器」(Crawler-friendly Web Servers)這一想法進行了改進。[6][7]2012年5月,Google宣佈,他們正嘗試在Sitemaps中添加rel="alternate"
和herflang。[8]Google表示,使用Sitemaps並不能保證Sitemap中的所有專案都會被抓取並編制索引,但在大多數情況下,站點設置Sitemap是有益的。[9]
檔案格式
Sitemaps協定格式由XML標籤組成。檔案本身必須為UTF-8編碼。Sitemaps也可以只是URL的純文字列表。[10]以下是僅包含一個URL並使用了所有可選標籤的範例。
<?xml version="1.0" encoding="utf-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9 http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd">
<url>
<loc>http://example.com/</loc>
<lastmod>2006-11-18</lastmod>
<changefreq>daily</changefreq>
<priority>0.8</priority>
</url>
</urlset>
一張站點地圖必須以<urlset>
開始,並在其中參照命名空間(為協定規範)。以</urlset>
結束。中間以<url>……</url>
分別列出每個專案,並使用<loc>……</loc>
列出URL。站點地圖的大小不得超過50MB、50,000個URL,若要列出超過50,000個URL,必須建立多個Sitemap檔案,並在一個站點地圖索引檔案中列出每個站點地圖檔案。網站地圖索引檔案不能列出超過50,000個站點地圖。[10]
文字檔案
Sitemaps也可以是文字檔案中的URL簡單列表,XML Sitemaps的檔案規範基本適用於文字Sitemaps。該檔案必須為UTF-8編碼,並且不能超過10MB,也不能包含超過50,000個URL,[11]但可以壓縮為gzip檔案。[10]
其他站點地圖類型
Google支援Sitemaps協定範圍之外的許多其他XML站點地圖類型,以允許網站管理員提供有關其網站內容的其他數據。影片和圖像的站點地圖,旨在提高網站在圖像和影片搜尋中的排名。[12][13]
影片站點地圖(Video Sitemaps)標示在搜尋結果中顯示的首選縮圖、影片發佈日期、影片時長和其他元數據。影片站點地圖還用於允許搜尋引擎索引嵌入在網站上、但在外部寄存(例如Vimeo或YouTube)的影片。[13]圖像站點地圖(Image Sitemaps)用於標示圖像元數據,例如許可資訊、地理位置和圖像標題。[12]Google新聞站點地圖(Google News Sitemaps)受Google支援,可以方便快速地索引新聞主題。[14][15]
參見
參考資料
外部連結
Wikiwand in your browser!
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.