W3Cschool
恭喜您成為首批注冊用戶
獲得88經(jīng)驗值獎勵
而不是執(zhí)行 ?start_requests()
? 生成的方法 ?scrapy.Request
? 來自URL的對象,您只需定義 ?start_urls
? 具有URL列表的類屬性。然后,此列表將由 ?start_requests()
? 要為您的蜘蛛創(chuàng)建初始請求,請執(zhí)行以下操作:
import scrapy
class QuotesSpider(scrapy.Spider):
name = "quotes"
start_urls = [
'http://quotes.toscrape.com/page/1/',
'http://quotes.toscrape.com/page/2/',
]
def parse(self, response):
page = response.url.split("/")[-2]
filename = f'quotes-{page}.html'
with open(filename, 'wb') as f:
f.write(response.body)
這個 ?parse()
? 方法將被調用來處理這些URL的每個請求,即使我們沒有明確地告訴Scrapy這樣做。這是因為 ?parse()
? 是Scrapy的默認回調方法,對沒有顯式分配回調的請求調用該方法。
Copyright©2021 w3cschool編程獅|閩ICP備15016281號-3|閩公網(wǎng)安備35020302033924號
違法和不良信息舉報電話:173-0602-2364|舉報郵箱:jubao@eeedong.com
掃描二維碼
下載編程獅App
編程獅公眾號
聯(lián)系方式:
更多建議: