W3Cschool
恭喜您成為首批注冊用戶
獲得88經(jīng)驗值獎勵
當(dāng)小程序內(nèi)容和 h5 內(nèi)容在數(shù)據(jù)、樣式等方面出現(xiàn)不對稱的情況,數(shù)據(jù)需要以 sitemap 形式輸出,保證可以更流暢地調(diào)起小程序,并且可以更全面地覆蓋數(shù)據(jù)源。
SiteMapIndex 文件要求:
1.sitemapindex 文件根節(jié)點必須是<sitemapindex>
。
2.sitemapindex 文件編碼必須為 UTF-8,第一行為: <?xml version="1.0" encoding="utf-8" ?>
。
3.sitemapindex 文件禁止使用命名空間,禁止使用規(guī)定之外的屬性。
4.sitemapindex 文件大小不得超過 5M,sitemap 節(jié)點數(shù)量不超過 5W。
5.必須保證 sitemap 中所有 URL 可訪問,且內(nèi)容符合 XML 數(shù)據(jù)文件規(guī)范。
SiteMapIndex 文件示例
<?xml version="1.0" encoding="utf-8" ?>
<sitemapindex>
<sitemap>
<loc>數(shù)據(jù)xml地址1</loc>
<lastmod>對應(yīng)的最后修改時間</lastmod>
</sitemap>
<sitemap>
<loc>數(shù)據(jù)xml地址2</loc>
<lastmod>對應(yīng)的最后修改時間</lastmod>
</sitemap>
</sitemapindex>
1.數(shù)據(jù) XML 文件的根節(jié)點必須為<DOCUMENT>
。
2.數(shù)據(jù) XML 文件編碼必須為 UTF-8,第一行為: <?xml version="1.0" encoding="utf-8" ?>
3.數(shù)據(jù) XML 文件禁止使用命名空間,禁止使用規(guī)定之外的屬性。
4.數(shù)據(jù) XML 單個文件大小不得超過 10M(必須滿足),item 數(shù)目不得超過 1W。
5.item 節(jié)點中<key>
、<display>
節(jié)點為必需節(jié)點。
6.除根節(jié)點之外的其它節(jié)點,標(biāo)簽名建議采用英文小寫字母及下劃線‘_’。
7.數(shù)據(jù)節(jié)點中包含轉(zhuǎn)義字符,請使用 CDATA。
8.對于數(shù)組型的節(jié)點,請在只有一個子節(jié)點時保證和多個節(jié)點時的結(jié)構(gòu)相同。
<?xml version="1.0" encoding="utf-8" ?>
<DOCUMENT>
<!--根節(jié)點必須為?寫DOCUMENT,標(biāo)記整個xml?件的開始和結(jié)束-->
<item>
<!-- 一個item為一條數(shù)據(jù),單文件最大允許5000個item,且文件大小不應(yīng)超過10M-->
<key>1238475hezuofang</key>
<!-- 使用ID,key長度限制1-64字符,內(nèi)容不能以空白符開頭和結(jié)束,且中間不能包含tab和換行。需要保證唯一,ID+合作方名稱-->
<display>
//<!-- 自定義數(shù)據(jù)區(qū)域,可以根據(jù)需求添加任意節(jié)點。 -->
//<!-- 節(jié)點總大小上限20KB,不建議超過3KB -->
<title>光硬件芯片來了,目標(biāo)取代硅硬件芯片</title>
<!--title: 標(biāo)題-->
<description><![CDATA[硬件(英文名Hardware)是計算機(jī)硬件的簡稱(中國大陸及香港用語,臺灣叫作:硬體),是指計算機(jī)系統(tǒng)中由電子,機(jī)械和光電元件等組成的各種物理裝置的總稱。這些物理裝置按系統(tǒng)]]></description>
<!-- 摘要字?jǐn)?shù)限制60字-->
<pic>http://pic.xxx.jpg</pic>
<!-- 封面圖鏈接 -->
<create_time>2016-01-29 08:19:52</create_time>
<!-- 創(chuàng)建時間 -->
<from>人民網(wǎng)</from>
<!-- 合作方來源 -->
當(dāng)item對應(yīng)的頁面唯一時,格式如下:
<url>http://m.xxx.com</url>
<!-- h5url -->
<lightapp_url>小程序內(nèi)部PATH,PATH開頭省略/,例如:page/xxx,而不是/page/xxx</lightapp_url>
<lightappid_url>小程序APPID</lightappid_url>
當(dāng)item下有多個頁面時,格式如下:
<lightapp_list>
<lightapp_item>
<url>http://m.xxx.com</url>
<!-- h5url -->
<lightapp_url>小程序內(nèi)部PATH,PATH開頭省略/,例如:page/xxx,而不是/page/xxx</lightapp_url>
</lightapp_item>
</lightapp_list>
<lightappid_url>小程序APPID</lightappid_url>
【上述兩種情況二選一,絕大多數(shù)是1中的類型】
【新增:注意sitemapindex文件大小不得超過5000k,由于實時抓取,量可控制小一些】
當(dāng)數(shù)據(jù)有新增,更改,刪減時不能在原有的sitemap格式上修改,需要新建一個sitemap文檔完成增減刪改等功能。需要在XML中添加如下字段:
<execute>add或modify或delete,代表增加、修改或刪除操作</execute>
<!-- execute字段增量sitemap必須提供,全量sitemap忽略 -->
</display>
</item>
</DOCUMENT>
Q:如果頁面中包含實時變動數(shù)據(jù)怎么辦? A:搜索側(cè)數(shù)據(jù) 10 分鐘獲取一次 sitemap,可以保證時效性。
Q:如果數(shù)據(jù)中有大量增量數(shù)據(jù)如何同步給頭條側(cè)? A:需要通過將增量 XML 灌入到 sitemap 文件中,頭條 RD 定期抓取。
Q:key 字段對應(yīng)的 ID 填什么? A:填該條數(shù)據(jù) ID,若沒有 ID 則取隨機(jī)值+合作方名稱,避免重復(fù)。如:<key>1238475hezuofang</key>
Copyright©2021 w3cschool編程獅|閩ICP備15016281號-3|閩公網(wǎng)安備35020302033924號
違法和不良信息舉報電話:173-0602-2364|舉報郵箱:jubao@eeedong.com
掃描二維碼
下載編程獅App
編程獅公眾號
聯(lián)系方式:
更多建議: