W3Cschool
恭喜您成為首批注冊(cè)用戶(hù)
獲得88經(jīng)驗(yàn)值獎(jiǎng)勵(lì)
爬蟲(chóng)訪問(wèn)小程序內(nèi)頁(yè)面時(shí),會(huì)攜帶特定的 user-agent "mpcrawler" 及場(chǎng)景值:1129
判斷請(qǐng)求是否來(lái)源于官方搜索爬蟲(chóng)的方法:
簽名算法與小程序消息推送接口的簽名算法一致。
參數(shù)在請(qǐng)求的header里設(shè)置,分別是: X-WXApp-Crawler-Timestamp X-WXApp-Crawler-Nonce X-WXApp-Crawler-Signature
簽名流程如下: 1.將token、X-WXApp-Crawler-Timestamp、X-WXApp-Crawler-Nonce三個(gè)參數(shù)進(jìn)行字典序排序 2.將三個(gè)參數(shù)字符串拼接成一個(gè)字符串進(jìn)行sha1加密 3.開(kāi)發(fā)者獲得加密后的字符串可與X-WXApp-Crawler-Signature對(duì)比,標(biāo)識(shí)該請(qǐng)求來(lái)源于微信
小程序頁(yè)面內(nèi)的跳轉(zhuǎn)url是我們爬蟲(chóng)發(fā)現(xiàn)頁(yè)面的重要來(lái)源,且搜索引擎召回的結(jié)果頁(yè)面 (url) 是必須能直接打開(kāi),不依賴(lài)上下文狀態(tài)的。 特別的:建議頁(yè)面所需的參數(shù)都包含在url
小程序提供了兩種頁(yè)面路由方式:a. navigator 組件b. 路由 API,包括 navigateTo / redirectTo / switchTab / navigateBack / reLaunch 建議使用 navigator 組件,若不得不使用API,可在爬蟲(chóng)訪問(wèn)時(shí)屏蔽針對(duì)點(diǎn)擊設(shè)置的時(shí)間鎖或變量鎖。
結(jié)構(gòu)清晰、簡(jiǎn)潔、參數(shù)有含義的 querystring 對(duì)抓取以及后續(xù)的分析都有很大幫助,但是將 JSON 數(shù)據(jù)作為參數(shù)的方式是比較糟糕的實(shí)現(xiàn)。
建議在必須的時(shí)候才要求用戶(hù)授權(quán)(比如閱讀文章可以匿名,而發(fā)表評(píng)論需要留名)。
我們暫時(shí)做不到這一點(diǎn),長(zhǎng)期來(lái)看,我們可能也做不到。
http://www.o2fo.com/weixinapp/weixinapp-cspq38rh.html
頁(yè)面標(biāo)題和縮略圖對(duì)于我們理解頁(yè)面和提高曝光轉(zhuǎn)化有重要的作用。 通過(guò) wx.setNavigationBarTitle 或 自定義轉(zhuǎn)發(fā)內(nèi)容 onShareAppMessage 對(duì)頁(yè)面的標(biāo)題和縮略圖設(shè)置,另外也為 video、audio 組件補(bǔ)齊 poster / poster-for-crawler 屬性。
可極大豐富微信可以收錄的內(nèi)容,進(jìn)而提高小程序內(nèi)容的曝光機(jī)會(huì)。請(qǐng)參考:
http://www.o2fo.com/weixinapp/weixinapp-it7838x9.html
Copyright©2021 w3cschool編程獅|閩ICP備15016281號(hào)-3|閩公網(wǎng)安備35020302033924號(hào)
違法和不良信息舉報(bào)電話:173-0602-2364|舉報(bào)郵箱:jubao@eeedong.com
掃描二維碼
下載編程獅App
編程獅公眾號(hào)
聯(lián)系方式:
更多建議: