scrapy 2.3 shell啟動外殼

2021-06-08 10:53 更新

要啟動碎屑?xì)?,可以使?nbsp;?shell? 命令如下:

scrapy shell <url>

何處 ?<url>? 是要擦除的URL。

?shell? 也適用于本地文件。如果你想玩一個網(wǎng)頁的本地副本,這很方便。 ?shell? 了解本地文件的以下語法::

# UNIX-style
scrapy shell ./path/to/file.html
scrapy shell ../other/path/to/file.html
scrapy shell /absolute/path/to/file.html

# File URI
scrapy shell file:///absolute/path/to/file.html

注解

使用相對文件路徑時,請顯式并用 ?./? (或) ?../? 相關(guān)時)。 ?scrapy shell index.html? 不會像人們預(yù)期的那樣工作(這是設(shè)計上的,而不是錯誤)。

因為 ?shell? 喜歡HTTP URL而不是文件URI,以及 ?index.html? 在句法上類似于 ?example.com? , ?shell? 會治療 ?index.html? 作為域名并觸發(fā)DNS查找錯誤::

$ scrapy shell index.html
[ ... scrapy shell starts ... ]
[ ... traceback ... ]
twisted.internet.error.DNSLookupError: DNS lookup failed:
address 'index.html' not found: [Errno -5] No address associated with hostname.

?shell? 如果文件調(diào)用了 ?index.html? 存在于當(dāng)前目錄中。同樣,要明確。

以上內(nèi)容是否對您有幫助:
在線筆記
App下載
App下載

掃描二維碼

下載編程獅App

公眾號
微信公眾號

編程獅公眾號