scrapy 2.3 圖像處理實例

2021-06-17 11:54 更新

為了使用媒體管道,首先 enable it .

那么,如果蜘蛛返回一個 item object 使用URL字段 (?file_urls? 或 ?image_urls? ,對于文件或圖像管道),管道會將結果放在相應的字段下 (?files? 或 ?images? )

使用時 item types 對于預先定義的字段,必須同時定義url字段和results字段。例如,當使用圖像管道時,項必須同時定義 ?image_urls? 以及 ?images? 字段。例如,使用 ?Item? 班級:

import scrapy

class MyItem(scrapy.Item):
    # ... other item fields ...
    image_urls = scrapy.Field()
    images = scrapy.Field()

如果要對URL鍵或結果鍵使用其他字段名,也可以重寫它。

對于文件管道,設置 ?FILES_URLS_FIELD? 和/或 ?FILES_RESULT_FIELD? 設置::

FILES_URLS_FIELD = 'field_name_for_your_files_urls'
FILES_RESULT_FIELD = 'field_name_for_your_processed_files'

對于圖像管道,設置 ?IMAGES_URLS_FIELD? 和/或 ?IMAGES_RESULT_FIELD? 設置::

IMAGES_URLS_FIELD = 'field_name_for_your_images_urls'
IMAGES_RESULT_FIELD = 'field_name_for_your_processed_images'

如果您需要更復雜的內容,并且想要覆蓋自定義管道行為,請參見 擴展媒體管道 .

如果有多個圖像管道繼承自ImagePipeline,并且希望在不同的管道中具有不同的設置,則可以設置以管道類的大寫名稱開頭的設置鍵。例如,如果您的管道名為mypipeline,并且您希望有自定義圖像URL字段,那么您可以定義設置mypipeline圖像URL字段,并且將使用自定義設置。

以上內容是否對您有幫助:
在線筆記
App下載
App下載

掃描二維碼

下載編程獅App

公眾號
微信公眾號

編程獅公眾號