W3Cschool
恭喜您成為首批注冊(cè)用戶(hù)
獲得88經(jīng)驗(yàn)值獎(jiǎng)勵(lì)
一些頁(yè)面(根據(jù)2013年的經(jīng)驗(yàn)數(shù)據(jù),高達(dá)1%)宣稱(chēng)自己是 ajax crawlable . 這意味著它們提供了內(nèi)容的純HTML版本,通常只能通過(guò)Ajax提供。頁(yè)面可以用兩種方式表示:
#!
? 在url中-這是默認(rèn)方式;Scrapy 處理(1)自動(dòng);處理(2)啟用 AjaxCrawlMiddleware ::
AJAXCRAWL_ENABLED = True
在進(jìn)行廣泛的爬行時(shí),通常會(huì)對(duì)許多“索引”網(wǎng)頁(yè)進(jìn)行爬行;AjaxCrawl中間件有助于正確地對(duì)它們進(jìn)行爬行。它在默認(rèn)情況下是關(guān)閉的,因?yàn)樗幸恍┬阅荛_(kāi)銷(xiāo),啟用它進(jìn)行聚焦爬行沒(méi)有什么意義。
Copyright©2021 w3cschool編程獅|閩ICP備15016281號(hào)-3|閩公網(wǎng)安備35020302033924號(hào)
違法和不良信息舉報(bào)電話(huà):173-0602-2364|舉報(bào)郵箱:jubao@eeedong.com
掃描二維碼
下載編程獅App
編程獅公眾號(hào)
聯(lián)系方式:
更多建議: