Scrapy與BeautifulSoup或LXML相比如何

2021-06-11 15:37 更新

BeautifulSoup 和 lxml 是用于分析HTML和XML的庫(kù)。Scrapy是一個(gè)應(yīng)用程序框架,用于編寫(xiě)爬行網(wǎng)站并從中提取數(shù)據(jù)的網(wǎng)絡(luò)蜘蛛。

Scrapy提供了一種用于提取數(shù)據(jù)的內(nèi)置機(jī)制(稱為:ref:selectors <topics-selectors>)但你可以輕松使用`BeautifulSoup`_(或`lxml`_),如果你覺(jué)得使用它們更舒服。 畢竟,他們只是解析可以從任何Python代碼導(dǎo)入和使用的庫(kù)。

換句話說(shuō),將`BeautifulSoup`_(或`lxml`_)與Scrapy進(jìn)行比較就像將`jinja2`_與`Django`_進(jìn)行比較。

以上內(nèi)容是否對(duì)您有幫助:
在線筆記
App下載
App下載

掃描二維碼

下載編程獅App

公眾號(hào)
微信公眾號(hào)

編程獅公眾號(hào)