Sitemap 介紹

2018-08-12 21:52 更新

Sitemap 介紹

一、什么是 Sitemap?

Sitemap(即站點(diǎn)地圖)就是您網(wǎng)站上各網(wǎng)頁的列表。創(chuàng)建并提交 Sitemap 有助于百度發(fā)現(xiàn)并了解您網(wǎng)站上的所有網(wǎng)頁。您還可以使用 Sitemap 提供有關(guān)您網(wǎng)站的其他信息,如上次更新日期、Sitemap 文件的更新頻率等,供百度 Spider 參考。

百度對(duì)已提交的數(shù)據(jù),不保證一定會(huì)抓取及索引所有網(wǎng)址。但是,我們會(huì)使用 Sitemap 中的數(shù)據(jù)來了解網(wǎng)站的結(jié)構(gòu)等信息,這樣可以幫助我們改進(jìn)抓取策略,并在日后能更好地對(duì)網(wǎng)站進(jìn)行抓取。

此外,Sitemap 與搜索排名沒有關(guān)系。

二、百度 Sitemap 協(xié)議都支持哪些格式?

百度 Sitemap 協(xié)議支持三種格式:文本格式、xml 格式、Sitemap 索引格式,可以根據(jù)自己情況來選擇任意一種格式組織 sitemap。具體格式說明及示例如下:

1.第一種格式樣例:txt 文本格式

在一個(gè) txt 文本列明需要向百度提交的鏈接地址,將 txt 文本文件通過站長(zhǎng)平臺(tái)進(jìn)行提交

此文本文件需要遵循以下指南:

文本文件每行都必須有一個(gè)網(wǎng)址。網(wǎng)址中不能有換行。不應(yīng)包含網(wǎng)址列表以外的任何信息。

您必須書寫完整的網(wǎng)址,包括 http。

每個(gè)文本文件最多可包含 50,000 個(gè)網(wǎng)址,并且應(yīng)小于 10MB(10,485,760 字節(jié))。如果網(wǎng)站所包含的網(wǎng)址超過 50,000 個(gè),則可將列表分割成多個(gè)文本文件,然后分別添加每個(gè)文件。

文本文件需使用 UTF-8 編碼或 GBK 編碼。

2.第二種格式樣例:xml 格式

單個(gè) xml 數(shù)據(jù)格式如下:

<?xml version="1.0" encoding="utf-8"?>
<!-- XML 文件需以 utf-8 編碼-->
<urlset>
<!--必填標(biāo)簽-->
    <url>
        <!--必填標(biāo)簽,這是具體某一個(gè)鏈接的定義入口,每一條數(shù)據(jù)都要用<url>和</url>包含在里面,這是必須的 -->
        <loc>http://www.yoursite.com/yoursite.html</loc>
        <!--必填,URL 鏈接地址,長(zhǎng)度不得超過 256 字節(jié)-->
        <lastmod>2009-12-14</lastmod>
        <!--可以不提交該標(biāo)簽,用來指定該鏈接的最后更新時(shí)間-->
        <changefreq>daily</changefreq>
        <!--可以不提交該標(biāo)簽,用這個(gè)標(biāo)簽告訴此鏈接可能會(huì)出現(xiàn)的更新頻率 -->
        <priority>0.8</priority>
        <!--可以不提交該標(biāo)簽,用來指定此鏈接相對(duì)于其他鏈接的優(yōu)先權(quán)比值,此值定于 0.0-1.0 之間-->
    </url>
    <url>
        <loc>http://www.yoursite.com/yoursite2.html</loc>
        <lastmod>2010-05-01</lastmod>
        <changefreq>daily</changefreq>
        <priority>0.8</priority>
    </url>
</urlset>

上述 Sitemap 向百度提交了一個(gè) url:http://www.yoursite.com/yoursite.html

若有多條 url,按照上述格式重復(fù)<url></url>之間的片斷,列明所有 url 地址,打包到一個(gè) xml 文件,向站長(zhǎng)平臺(tái)進(jìn)行提交。

3.第三種格式樣例:Sitemap 索引格式

如需提交大量 sitemap 文件,則可將其列在 sitemap 索引文件中,然后將該索引文件提交。您無需分別提交每個(gè)文件。

<?xml version="1.0" encoding="utf-8"?>
<!-- XML 文件需以 utf-8 編碼-->
<sitemapindex>
<!--必填,以 <sitemapindex> 開始標(biāo)記作為開始,以 </sitemapindex> 結(jié)束標(biāo)記作為結(jié)束-->
    <sitemap>
        <!--必填,以<sitemap>標(biāo)簽提交一個(gè)子 sitemap 文件-->
        <loc>http://example.com/ext/xmlsitemap/add/201201/index_20120106.xml</loc>
        <!--必填,識(shí)別 sitemap 的位置-->
        <lastmod>2009-12-14</lastmod>
        <!--選填,識(shí)別相對(duì) sitemap 文件的修改時(shí)間-->
    </sitemap>

    <!--必填,標(biāo)簽閉合-->

</sitemapindex>

<!--必填,標(biāo)簽閉合-->

有多個(gè) Sitemap,按上述格式重復(fù)<sitemap></sitemap>之間的片斷,列明所有 Sitemap 地址,向站長(zhǎng)平臺(tái)進(jìn)行提交。

三、什么是移動(dòng) Sitemap 協(xié)議,如何提交 Sitemap 到移動(dòng)搜索?

百度推出了移動(dòng) Sitemap 協(xié)議,用于將網(wǎng)址提交給移動(dòng)搜索收錄。百度移動(dòng) Sitemap 協(xié)議是在標(biāo)準(zhǔn) Sitemap 協(xié)議基礎(chǔ)上制定的,增加了標(biāo)簽,它有三種取值:

<mobile:mobile/> :移動(dòng)網(wǎng)頁

<mobile:mobile type="mobile"/> :移動(dòng)網(wǎng)頁

<mobile:mobile type="autoadapt"/>:自適配網(wǎng)頁,適用于同一網(wǎng)址頁面,會(huì)隨設(shè)備不同改變展現(xiàn)的情況。

無該標(biāo)簽表示 PC 的網(wǎng)頁

下方樣例相當(dāng)于向百度移動(dòng)搜索提交了一個(gè)移動(dòng)網(wǎng)頁:http://m.example.com/index.html,向 PC 搜索提交了一個(gè)傳統(tǒng)網(wǎng)頁:http://www.example.com/index.html,同時(shí)向移動(dòng)搜索和 PC 搜索提交了一個(gè)自適配網(wǎng)頁 http://www.example.com/autoadapt.html

<?xml version="1.0" encoding="UTF-8" ?> 
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
xmlns:mobile="http://www.baidu.com/schemas/sitemap-mobile/1/"> 
<url> 
<loc>http://m.example.com/index.html</loc> 
<mobile:mobile type="mobile"/>
<lastmod>2009-12-14</lastmod>
<changefreq>daily</changefreq>
<priority>0.8</priority>
</url> 
<url> 
<loc>http://www.example.com/index.html</loc>
<lastmod>2009-12-14</lastmod>
<changefreq>daily</changefreq>
<priority>0.8</priority>
</url> 
<url> 
<loc>http://www.example.com/autoadapt.html</loc> 
<mobile:mobile type="autoadapt"/>
<lastmod>2009-12-14</lastmod>
<changefreq>daily</changefreq>
<priority>0.8</priority>
</url> 
</urlset>

提交 Sitemap 到移動(dòng)搜索的方法,參考第四條,按照移動(dòng) Sitemap 協(xié)議做好 Sitemap 后,在 Sitemap 工具點(diǎn)擊添加新數(shù)據(jù)提交,與提交普通 Sitemap 方式一致。

四、創(chuàng)建 sitemap 時(shí)有哪些注意事項(xiàng)?如何提交 sitemap?

注意事項(xiàng)

一個(gè) Sitemap 文件包含的網(wǎng)址不得超過 5 萬個(gè),且文件大小不得超過 10 MB。如果您的 Sitemap 超過了這些限值,請(qǐng)將其拆分為幾個(gè)小的 Sitemap。這些限制條件有助于確保您的網(wǎng)絡(luò)服務(wù)器不會(huì)因提供大文件而超載。

一次性最多提交 50 個(gè)地址,提交地址的文件類型和更新周期必須一致。

如果驗(yàn)證了網(wǎng)站的主域,那么 Sitemap 文件中可包含該網(wǎng)站主域下的所有網(wǎng)址。

如果驗(yàn)證的 www.example.com,你只能提交該驗(yàn)證網(wǎng)站的網(wǎng)址,不能出現(xiàn)其他網(wǎng)站的網(wǎng)址。

提交步驟

將需提交的網(wǎng)頁列表制作成一個(gè) Sitemap 文件,文件格式請(qǐng)閱讀百度 Sitemap 協(xié)議都支持哪些格式。

將 Sitemap 文件放置在網(wǎng)站目錄下。比如您的網(wǎng)站為 example.com,您已制作了一個(gè) sitemap_example.xml 的 Sitemap 文件,將 sitemap_example.xml 上傳至網(wǎng)站根目錄即 example.com/sitemap_example.xml

登錄百度站長(zhǎng)平臺(tái),確保提交 Sitemap 數(shù)據(jù)的網(wǎng)站已驗(yàn)證歸屬。

進(jìn)入 Sitemap 工具,點(diǎn)擊“添加新數(shù)據(jù)”,文件類型選擇“URL 列表”,填寫抓取周期和 Sitemap 文件地址

提交完之后,可在 Sitemap 列表里看到提交的 Sitemap 文件,如果 Sitemap 文件里面有新的網(wǎng)站鏈接,可以選擇文件后,點(diǎn)擊更新所選,即對(duì)更新的網(wǎng)站鏈接進(jìn)行了提交。

五、我提交時(shí)填寫的周期是什么含義?

百度 Spider 會(huì)參考設(shè)置周期抓取 Sitemap 文件,因此請(qǐng)根據(jù) Sitemap 文件內(nèi)容的更新(比如增加新 url)來設(shè)置。請(qǐng)注意若 url 不變而僅是 url 對(duì)應(yīng)的頁面內(nèi)容更新(比如論壇帖子頁有新回復(fù)內(nèi)容),不在此更新范圍內(nèi)。Sitemap 工具不能解決頁面更新問題。

六、Sitemap 提交后,多久能被百度處理?

Sitemap 數(shù)據(jù)提交后,一般在 1 小時(shí)內(nèi)百度會(huì)開始處理。處理完成的時(shí)間視文件大小和您設(shè)置的抓取周期而定。

七、提交的 Sitemap 都會(huì)被百度抓取并收錄嗎?

百度對(duì)已提交的數(shù)據(jù),不保證一定會(huì)抓取及收錄所有網(wǎng)址。是否收錄與頁面質(zhì)量相關(guān)。

八、我可以壓縮我的 Sitemap 嗎?它們是否需要用 gzip 壓縮?

可以。請(qǐng)使用 gzip 壓縮 Sitemap。無論壓縮與否,Sitemap 應(yīng)該小于 10MB(10,485,759 字節(jié))。

九、XML 格式的 Sitemap 中,“priority”提示會(huì)影響我的網(wǎng)頁在搜索結(jié)果中的排名嗎?

不會(huì)。Sitemap 中的“priority”提示只是說明該網(wǎng)址相對(duì)于您自己網(wǎng)站上其他網(wǎng)址的重要性,并不會(huì)影響網(wǎng)頁在搜索結(jié)果中的排名。

十、網(wǎng)址在 Sitemap 中的位置是否會(huì)影響它的使用?

不會(huì)。網(wǎng)址在 Sitemap 中的位置并不會(huì)影響百度對(duì)它的識(shí)別或使用方式。

十一、Sitemap 中提交的 url 能否包含中文?

因?yàn)檗D(zhuǎn)碼問題建議最好不要包含中文。

以上內(nèi)容是否對(duì)您有幫助:
在線筆記
App下載
App下載

掃描二維碼

下載編程獅App

公眾號(hào)
微信公眾號(hào)

編程獅公眾號(hào)