W3Cschool
恭喜您成為首批注冊(cè)用戶
獲得88經(jīng)驗(yàn)值獎(jiǎng)勵(lì)
BeautifulSoup 和 lxml 是用于分析HTML和XML的庫(kù)。Scrapy是一個(gè)應(yīng)用程序框架,用于編寫(xiě)爬行網(wǎng)站并從中提取數(shù)據(jù)的網(wǎng)絡(luò)蜘蛛。
Scrapy提供了一種用于提取數(shù)據(jù)的內(nèi)置機(jī)制(稱為:ref:selectors <topics-selectors>)但你可以輕松使用`BeautifulSoup`_(或`lxml`_),如果你覺(jué)得使用它們更舒服。 畢竟,他們只是解析可以從任何Python代碼導(dǎo)入和使用的庫(kù)。
換句話說(shuō),將`BeautifulSoup`_(或`lxml`_)與Scrapy進(jìn)行比較就像將`jinja2`_與`Django`_進(jìn)行比較。
Copyright©2021 w3cschool編程獅|閩ICP備15016281號(hào)-3|閩公網(wǎng)安備35020302033924號(hào)
違法和不良信息舉報(bào)電話:173-0602-2364|舉報(bào)郵箱:jubao@eeedong.com
掃描二維碼
下載編程獅App
編程獅公眾號(hào)
聯(lián)系方式:
更多建議: