scrapy 2.3 安裝指南
1. scrapy 2.3 安裝教程
2. scrapy 2.3 Windows環(huán)境搭建教程
3. scrapy 2.3 Ubuntu環(huán)境搭建教程
4. scrapy 2.3 macOS環(huán)境搭建教程
5. scrapy 2.3 PyPy環(huán)境搭建教程
6. scrapy 2.3 故障排除
scrapy 2.3 教程
1. scrapy 2.3 創(chuàng)建項目
2. scrapy 2.3 創(chuàng)建蜘蛛
3. scrapy 2.3 如何運(yùn)行我們的蜘蛛
4. scrapy 2.3 請求方法快捷方式
5. scrapy 2.3 提取數(shù)據(jù)
6. scrapy 2.3 在蜘蛛中提取數(shù)據(jù)
7. scrapy 2.3 存儲抓取的數(shù)據(jù)
8. scrapy 2.3 數(shù)據(jù)抓取實(shí)例
9. scrapy 2.3 蜘蛛?yún)?shù)
scrapy 2.3 命令行工具
1. scrapy 2.3 配置設(shè)置
2. scrapy 2.3 報廢項目的默認(rèn)結(jié)構(gòu)
3. scrapy 2.3 在項目之間共享根目錄
4. scrapy 2.3 工具
5. scrapy 2.3 可用工具命令
6. scrapy 2.3 自定義項目命令
scrapy 2.3 蜘蛛
1. scrapy 2.3 scrapy.Spider
2. scrapy 2.3 蜘蛛爬取參數(shù)
3. scrapy 2.3 類蜘蛛CrawlSpider
4. scrapy 2.3 XMLFeedSpider
5. scrapy 2.3 CSVFeedSpider
6. scrapy 2.3 SitemapSpider
scrapy 2.3 選擇器
1. scrapy 2.3 使用選擇器
2. scrapy 2.3 使用xpaths
3. scrapy 2.3 內(nèi)置選擇器引
  1. scrapy 2.3 SelectorList對象
4. scrapy 2.3 選擇器實(shí)例
  1. scrapy 2.3 HTML響應(yīng)的選擇器示例
  2. scrapy 2.3 XML響應(yīng)的選擇器示例
scrapy 2.3 項目
1. scrapy 2.3 項目類型
2. scrapy 2.3 使用項目對象
3. scrapy 2.3 支持所有項目類型
4. scrapy 2.3 與項目相關(guān)的其他類別
scrapy 2.3 項目加載器
1. scrapy 2.3 使用項目加載器填充項目
2. scrapy 2.3 使用dataclass項
3. scrapy 2.3 輸入和輸出處理器
4. scrapy 2.3 聲明項加載器
5. scrapy 2.3 聲明輸入和輸出處理器
6. scrapy 2.3 項目加載器上下文
7. scrapy 2.3 嵌套裝載機(jī)
8. scrapy 2.3 重復(fù)使用和擴(kuò)展項目加載器
scrapy 2.3 shell
1. scrapy 2.3 配置shell
2. scrapy 2.3 shell啟動外殼
3. scrapy 2.3 shell使用外殼
  1. scrapy 2.3 shell可用快捷方式
  2. scrapy 2.3 Shell可用對象
4. scrapy 2.3 Shell會話示例
5. scrapy 2.3 從spiders調(diào)用shell來檢查響應(yīng)
scrapy 2.3 項目管道
1. scrapy 2.3 編寫自己的項目管道
2. scrapy 2.3 項目管道示例
3. scrapy 2.3 激活項目管道組件
scrapy 2.3 Feed導(dǎo)出
1. scrapy 2.3 序列化格式
2. scrapy 2.3 儲藏室
3. scrapy 2.3 存儲URI參數(shù)
4. scrapy 2.3 存儲后端
5. scrapy 2.3 Feed導(dǎo)出設(shè)置
scrapy 2.3 請求和響應(yīng)
1. 無標(biāo)題文章
2. scrapy 2.3 停止下載響應(yīng)
3. scrapy 2.3 請求子類
  1. scrapy 2.3 FormRequest對象
4. scrapy 2.3 響應(yīng)子類
scrapy 2.3 鏈接提取器
scrapy 2.3 設(shè)置
1. scrapy 2.3 填充設(shè)置
2. scrapy 2.3 導(dǎo)入路徑和類
3. scrapy 2.3 如何訪問設(shè)置
4. scrapy 2.3 內(nèi)置設(shè)置參考
scrapy 2.3 內(nèi)置異常引用
scrapy 2.3 登錄
1. scrapy 2.3 日志級別
2. scrapy 2.3 如何記錄消息
3. scrapy 2.3 從蜘蛛記錄
4. scrapy 2.3 日志記錄配置
scrapy 2.3 統(tǒng)計數(shù)據(jù)集合
1. scrapy 2.3 常用統(tǒng)計信息收集器使用
scrapy 2.3 發(fā)送電子郵件
1. scrapy 2.3 郵件設(shè)置
scrapy 2.3 遠(yuǎn)程登錄控制臺
1. scrapy 2.3 telnet控制臺中的可用變量
2. scrapy 2.3 telnet控制臺使用示例
3. scrapy 2.3 Telnet控制臺信號
4. scrapy 2.3 遠(yuǎn)程登錄設(shè)置
scrapy 2.3 常見問題
1. Scrapy與BeautifulSoup或LXML相比如何
2. BeautifulSoup能和Scrapy一起使用嗎？
3. Scrapy是否從Django“竊取”X？
4. Scrapy能與HTTP代理一起工作嗎？
5. Scrapy是以廣度優(yōu)先還是深度優(yōu)先的順序爬行？
6. 響應(yīng)狀態(tài)代碼999是什么意思？
7. 我可以從我的蜘蛛調(diào)用``pdb.set_trace（）``來調(diào)試它們嗎？
8. 如何將我的所有抓取項轉(zhuǎn)儲到j(luò)son/csv/xml文件中？
9. 我應(yīng)該使用蜘蛛?yún)?shù)或設(shè)置來配置我的蜘蛛嗎？
10. 如何在項目管道中將項目拆分為多個項目？
scrapy 2.3 調(diào)試spiders
1. scrapy 2.3 解析命令
2. scrapy 2.3 Scrapy Shell
3. scrapy 2.3 在瀏覽器中打開
4. scrapy 2.3 登錄
scrapy 2.3 蜘蛛合約
1. scrapy 2.3 正在檢測檢查運(yùn)行
scrapy 2.3 常用做法
1. scrapy 2.3 怎么從腳本中運(yùn)行
2. scrapy 2.3 在同一進(jìn)程中運(yùn)行多個spider
3. scrapy 2.3 分布式爬行
4. scrapy 2.3 避免被禁止
scrapy 2.3 寬爬行
1. scrapy 2.3 使用權(quán)利
2. scrapy 2.3 增加并發(fā)性
3. scrapy 2.3 增加Twisted IO線程池的最大大小
4. scrapy 2.3 設(shè)置您自己的DNS
5. scrapy 2.3 降低日志級別
6. scrapy 2.3 禁用Cookie
7. scrapy 2.3 禁用重試
8. scrapy 2.3 減少下載超時
9. scrapy 2.3 禁用重定向
10. scrapy 2.3 啟用“Ajax可爬行頁”的爬行
11. scrapy 2.3 按BFO順序爬行
12. scrapy 2.3 注意內(nèi)存泄漏
13. scrapy 2.3 安裝一個特殊的扭曲反應(yīng)器
scrapy 2.3 使用瀏覽器的開發(fā)人員工具進(jìn)行抓取
1. scrapy 2.3 檢查實(shí)時瀏覽器DOM時的注意事項
2. scrapy 2.3 查看網(wǎng)站
3. scrapy 2.3 網(wǎng)絡(luò)工具
scrapy 2.3 選擇動態(tài)加載的內(nèi)容
1. scrapy 2.3 查找數(shù)據(jù)源
2. scrapy 2.3 檢查網(wǎng)頁的源代碼
3. scrapy 2.3 復(fù)制請求
4. scrapy 2.3 處理不同的響應(yīng)格式
5. scrapy 2.3 分析javascript代碼
6. scrapy 2.3 預(yù)渲染JavaScript
7. scrapy 2.3 使用無頭瀏覽器
scrapy 2.3 調(diào)試內(nèi)存泄漏
1. scrapy 2.3 內(nèi)存泄漏的常見原因
2. scrapy 2.3 使用調(diào)試內(nèi)存泄漏 trackref
3. scrapy 2.3 用muppy調(diào)試內(nèi)存泄漏
4. scrapy 2.3 無泄漏泄漏
scrapy 2.3 下載和處理文件和圖像
1. scrapy 2.3 使用文件管道
2. scrapy 2.3 使用圖像管道
3. scrapy 2.3 啟用媒體管道
4. scrapy 2.3 支持的存儲
5. scrapy 2.3 圖像處理實(shí)例
6. scrapy 2.3 下載處理其他功能
7. scrapy 2.3 擴(kuò)展媒體管道
8. scrapy 2.3 自定義圖像管道示例
scrapy 2.3 如何部署蜘蛛
scrapy 2.3 AutoThrottle擴(kuò)展
scrapy 2.3 標(biāo)桿管理
scrapy 2.3 暫停和恢復(fù)爬行
scrapy 2.3 協(xié)同程序
scrapy 2.3 asyncio

閱讀(1.5k) 書簽贊(0) 我要糾錯

scrapy 2.3 文本響應(yīng)對象

2021-06-10 09:53 更新

下面是可用的內(nèi)置響應(yīng)子類的列表。您還可以對響應(yīng)類進(jìn)行子類化，以實(shí)現(xiàn)您自己的功能。

文本響應(yīng)對象

classscrapy.http.TextResponse(url[, encoding[, ...]])

?TextResponse? 對象將編碼功能添加到基 ?Response? 類，它只用于二進(jìn)制數(shù)據(jù)，如圖像、聲音或任何媒體文件。

?TextResponse? 對象支持新的 __init__ 方法參數(shù)，以及基 ?Response? 物體。其余功能與 ?Response? 類，此處未記錄。

參數(shù): encoding (str) -- 包含用于此響應(yīng)的編碼的字符串。如果創(chuàng)建一個 ?TextResponse? 對象，它將轉(zhuǎn)換為使用此編碼編碼的字節(jié)。如果編碼是 None （默認(rèn)），將在響應(yīng)頭和正文中查找編碼。

?TextResponse? 除了標(biāo)準(zhǔn)之外，對象還支持以下屬性 ?Response? 一：

text

響應(yīng)體，作為字符串。

一樣 response.body.decode(response.encoding) ，但結(jié)果在第一次調(diào)用后緩存，因此您可以訪問 response.text 多次無額外開銷。

注解

str(response.body) 不是將響應(yīng)正文轉(zhuǎn)換為字符串的正確方法：

>>> str(b'body')
"b'body'"

encoding

帶有此響應(yīng)編碼的字符串。按順序嘗試以下機(jī)制來解決編碼問題：

傳入的編碼 __init__ 方法 encoding 參數(shù)
在內(nèi)容類型HTTP標(biāo)頭中聲明的編碼。如果此編碼無效（即未知），則忽略它并嘗試下一個解析機(jī)制。
響應(yīng)正文中聲明的編碼。TextResponse類不為此提供任何特殊功能。然而， ?HtmlResponse? 和 ?XmlResponse? 上課。
通過查看響應(yīng)主體推斷出的編碼。這是更脆弱的方法，也是最后一個嘗試的方法。

selector: A ?Selector? 使用響應(yīng)作為目標(biāo)的實(shí)例。選擇器在第一次訪問時被惰性地實(shí)例化。

?TextResponse? 對象除了支持標(biāo)準(zhǔn)之外還支持以下方法 ?Response? 一：

xpath(query)

捷徑 TextResponse.selector.xpath(query) ：：

response.xpath('//p')

css(query)

捷徑 TextResponse.selector.css(query) ：：

response.css('p')

follow(url, callback=None, method='GET', headers=None, body=None, cookies=None, meta=None, encoding=None, priority=0, dont_filter=False, errback=None, cb_kwargs=None, flags=None)

返回A ?Request? 要跟蹤鏈接的實(shí)例 url . 它接受與 Request.__init__ 方法，但 url 不僅可以是絕對URL，而且可以是

相對URL
一 ?Link? 對象，例如鏈接提取器
一 ?Selector? 對象 <link> 或 <a> 元素，例如 response.css('a.my_link')[0]
屬性 ?Selector? （不是選擇器列表），例如。 response.css('a::attr(href)')[0] 或 response.xpath('//img/@src')[0]

見創(chuàng)建請求的快捷方式用于示例。

follow_all(urls=None, callback=None, method='GET', headers=None, body=None, cookies=None, meta=None, encoding=None, priority=0, dont_filter=False, errback=None, cb_kwargs=None, flags=None, css=None, xpath=None)

產(chǎn)生 ?Request? 跟蹤所有鏈接的實(shí)例 urls . 它接受與 ?Request? 的 __init__ 方法，除了 urls 元素不需要是絕對URL，它可以是以下任何一個：

相對URL
一 ?Link? 對象，例如鏈接提取器
一 ?Selector? 對象 <link> 或 <a> 元素，例如 response.css('a.my_link')[0]
屬性 ?Selector? （不是選擇器列表），例如。 response.css('a::attr(href)')[0] 或 response.xpath('//img/@src')[0]

此外， css 和 xpath 參數(shù)可用于在中執(zhí)行鏈接提取 follow_all 方法（只有一個 urls ， css 和 xpath 接受）。

注意，當(dāng)經(jīng)過 SelectorList 作為 urls 參數(shù)或使用 css 或 xpath 參數(shù)時，此方法不會為無法從中獲取鏈接的選擇器生成請求（例如，沒有 href 屬性）

json()

2.2 新版功能.

將JSON文檔反序列化為Python對象。

從反序列化的JSON文檔返回Python對象。結(jié)果在第一次調(diào)用后被緩存。

HTMLResponse對象

classscrapy.http.HtmlResponse(url[, ...]): 這個 ?HtmlResponse? 類是的子類 ?TextResponse? 它通過查看HTML添加了編碼自動發(fā)現(xiàn)支持 meta http-equiv 屬性。見 ?TextResponse.encoding? .

XmlResponse對象

classscrapy.http.XmlResponse(url[, ...]): 這個 ?XmlResponse? 類是的子類 ?TextResponse? 它通過查看XML聲明行添加了編碼自動發(fā)現(xiàn)支持。見 ?TextResponse.encoding? .

以上內(nèi)容是否對您有幫助：

← scrapy 2.3 FormRequest對象

scrapy 2.3 鏈接提取器 →

寫筆記

我要補(bǔ)充

scrapy 2.3 文本響應(yīng)對象

文本響應(yīng)對象

HTMLResponse對象

XmlResponse對象

推薦文章

推薦教程

推薦課程