昆明網(wǎng)站建設(shè)哪家好網(wǎng)絡(luò)推廣入門教程
標題 | 詳情 |
---|---|
作者簡介 | 愚公搬代碼 |
頭銜 | 華為云特約編輯,華為云云享專家,華為開發(fā)者專家,華為產(chǎn)品云測專家,CSDN博客專家,CSDN商業(yè)化專家,阿里云專家博主,阿里云簽約作者,騰訊云優(yōu)秀博主,騰訊云內(nèi)容共創(chuàng)官,掘金優(yōu)秀博主,亞馬遜技領(lǐng)云博主,51CTO博客專家等。 |
近期榮譽 | 2022年度博客之星TOP2,2023年度博客之星TOP2,2022年華為云十佳博主,2023年華為云十佳博主,2024年華為云十佳博主等。 |
博客內(nèi)容 | .NET、Java、Python、Go、Node、前端、IOS、Android、鴻蒙、Linux、物聯(lián)網(wǎng)、網(wǎng)絡(luò)安全、大數(shù)據(jù)、人工智能、U3D游戲、小程序等相關(guān)領(lǐng)域知識。 |
歡迎 | 👍點贊、?評論、?收藏 |
文章目錄
- 🚀前言
- 🚀一、請求模塊urllib3
- 🔎1. urllib3 簡介
- 🔎2. 安裝 urllib3
- 🔎3. 發(fā)送網(wǎng)絡(luò)請求
- 🦋3.1 GET 請求
- 🦋3.2 POST 請求
- 🦋3.3 請求重試
- 🔎4. 處理響應內(nèi)容
- 🦋4.1 獲取響應頭
- 🦋4.2 處理 JSON 響應
- 🦋4.3 處理二進制數(shù)據(jù)(如圖片)
- 🔎5.復雜請求的發(fā)送
- 🦋5.1 設(shè)置請求頭
- 🦋5.2 設(shè)置超時
- 🦋5.3 設(shè)置代理
- 🔎6.上傳文件
🚀前言
在現(xiàn)代編程中,網(wǎng)絡(luò)請求是一個不可或缺的環(huán)節(jié),無論是數(shù)據(jù)抓取、API調(diào)用還是后端服務(wù)的交互,都會涉及到網(wǎng)絡(luò)通訊。而在眾多網(wǎng)絡(luò)請求庫中,urllib3因其強大的功能和易用性,成為了許多開發(fā)者的首選。它不僅提供了對HTTP協(xié)議的全面支持,還具備連接池、重試機制和SSL/TLS驗證等多種實用特性。
在本文中,我們將深入探討urllib3模塊的基本用法,幫助你更好地理解如何利用這個庫進行高效的網(wǎng)絡(luò)請求。不論你是初學者還是有經(jīng)驗的開發(fā)者,掌握urllib3都將為你的項目帶來極大的便利。
🚀一、請求模塊urllib3
🔎1. urllib3 簡介
- 定義:urllib3 是一個功能強大、結(jié)構(gòu)清晰的 Python HTTP 客戶端庫,被許多原生 Python 系統(tǒng)采用。
- 核心特性:
- 線程安全
- 連接池管理
- 客戶端 SSL/TLS 驗證
- 多部分編碼文件上傳
- 請求重試與 HTTP 重定向處理
- 支持 gzip/deflate 編碼
- 支持 HTTP/SOCKS 代理
- 100% 測試覆蓋率
🔎2. 安裝 urllib3
- 通過
pip
安裝(非 Anaconda 環(huán)境):pip install urllib3
🔎3. 發(fā)送網(wǎng)絡(luò)請求
🦋3.1 GET 請求
- 步驟:
- 創(chuàng)建
PoolManager
對象管理連接池。 - 調(diào)用
request()
方法發(fā)送請求。
- 創(chuàng)建
- 語法:
request(method, url, fields=None, headers=None, urlopen_kw)
method
: 請求方法(如GET
、POST
)。url
: 目標 URL。fields
: 請求參數(shù)(字典形式)。headers
: 請求頭(字典形式)。
示例 1:基礎(chǔ) GET 請求
import urllib3 # 導入urllib3模塊
url = "http://httpbin.org/get"
http = urllib3.PoolManager() # 創(chuàng)建連接池管理對象
r = http.request('GET',url) # 發(fā)送GET請求
print(r.status) # 打印請求狀態(tài)碼
示例 2:多服務(wù)器請求
import urllib3 # 導入urllib3模塊
urllib3.disable_warnings() # 關(guān)閉ssl警告
jingdong_url = 'https://www.jd.com/' # 京東url地址
python_url = 'https://www.python.org/' # Python url地址
baidu_url = 'https://www.baidu.com/' # 百度url地址
http = urllib3.PoolManager() # 創(chuàng)建連接池管理對象
r1 = http.request('GET',jingdong_url) # 向京東地址發(fā)送GET請求
r2 = http.request('GET',python_url) # 向python地址發(fā)送GET請求
r3 = http.request('GET',baidu_url) # 向百度地址發(fā)送GET請求
print('京東請求狀態(tài)碼:',r1.status)
print('python請求狀態(tài)碼:',r2.status)
print('百度請求狀態(tài)碼:',r3.status)
🦋3.2 POST 請求
- 關(guān)鍵:設(shè)置
method='POST'
并通過fields
傳遞表單數(shù)據(jù)。
示例 3:發(fā)送 POST 請求
import urllib3 # 導入urllib3模塊
urllib3.disable_warnings() # 關(guān)閉ssl警告
url = 'https://www.httpbin.org/post' # post請求測試地址
params = {'name':'Jack','country':'中國','age':30} # 定義字典類型的請求參數(shù)
http = urllib3.PoolManager() # 創(chuàng)建連接池管理對象
r = http.request('POST',url,fields=params) # 發(fā)送POST請求
print('返回結(jié)果:',r.data.decode('utf-8'))
🦋3.3 請求重試
- 參數(shù):
retries
控制重試次數(shù)(默認 3 次,False
禁用重試)。
示例 4:設(shè)置重試策略
import urllib3 # 導入urllib3模塊
urllib3.disable_warnings() # 關(guān)閉ssl警告
url = 'https://www.httpbin.org/get' # get請求測試地址
http = urllib3.PoolManager() # 創(chuàng)建連接池管理對象
r = http.request('GET',url) # 發(fā)送GET請求,默認重試請求
r1 = http.request('GET',url,retries=5) # 發(fā)送GET請求,設(shè)置5次重試請求
r2 = http.request('GET',url,retries=False) # 發(fā)送GET請求,關(guān)閉重試請求
print('默認重試請求次數(shù):',r.retries.total)
print('設(shè)置重試請求次數(shù):',r1.retries.total)
print('關(guān)閉重試請求次數(shù):',r2.retries.total)
🔎4. 處理響應內(nèi)容
🦋4.1 獲取響應頭
import urllib3 # 導入urllib3模塊
urllib3.disable_warnings() # 關(guān)閉ssl警告
url = 'https://www.httpbin.org/get' # get請求測試地址
http = urllib3.PoolManager() # 創(chuàng)建連接池管理對象
r = http.request('GET',url) # 發(fā)送GET請求,默認重試請求
response_header = r.info() # 獲取響應頭
for key in response_header.keys(): # 循環(huán)遍歷打印響應頭信息print(key,':',response_header.get(key))
🦋4.2 處理 JSON 響應
import urllib3 # 導入urllib3模塊
import json # 導入json模塊
urllib3.disable_warnings() # 關(guān)閉ssl警告
url = 'https://www.httpbin.org/post' # post請求測試地址
params = {'name':'Jack','country':'中國','age':30} # 定義字典類型的請求參數(shù)
http = urllib3.PoolManager() # 創(chuàng)建連接池管理對象
r = http.request('POST',url,fields=params) # 發(fā)送POST請求
j = json.loads(r.data.decode('unicode_escape')) # 將響應數(shù)據(jù)轉(zhuǎn)換為字典類型
print('數(shù)據(jù)類型:',type(j))
print('獲取form對應的數(shù)據(jù):',j.get('form'))
print('獲取country對應的數(shù)據(jù):',j.get('form').get('country'))
🦋4.3 處理二進制數(shù)據(jù)(如圖片)
import urllib3 # 導入urllib3模塊
urllib3.disable_warnings() # 關(guān)閉ssl警告
url = 'https://search-operate.cdn.bcebos.com/4466f881476a1ee804b4a32aee790675.gif' # 圖片請求地址
http = urllib3.PoolManager() # 創(chuàng)建連接池管理對象
r = http.request('GET',url) # 發(fā)送網(wǎng)絡(luò)請求
print(r.data) # 打印二進制數(shù)據(jù)
f = open('python.png','wb+') # 創(chuàng)建open對象
f.write(r.data) # 寫入數(shù)據(jù)
f.close() # 關(guān)閉
🔎5.復雜請求的發(fā)送
🦋5.1 設(shè)置請求頭
- 目的:模擬瀏覽器請求,避免被服務(wù)器識別為爬蟲。
- 實現(xiàn)步驟:
- 獲取請求頭信息:
- 在瀏覽器(如 Firefox)中按
F12
打開開發(fā)者工具。 - 訪問目標網(wǎng)頁(如
https://www.baidu.com
)。 - 在“網(wǎng)絡(luò)”選項卡中選擇一個請求,復制其
User-Agent
值。
- 在瀏覽器(如 Firefox)中按
- 設(shè)置請求頭:將
User-Agent
作為字典鍵,瀏覽器信息作為值。
- 獲取請求頭信息:
示例:設(shè)置請求頭
import urllib3 # 導入urllib3模塊
urllib3.disable_warnings() # 關(guān)閉ssl警告
url = 'https://www.httpbin.org/get' # get請求測試地址
# 定義火狐瀏覽器請求頭信息
headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:77.0) Gecko/20100101 Firefox/77.0'}
http = urllib3.PoolManager() # 創(chuàng)建連接池管理對象
r = http.request('GET',url,headers=headers) # 發(fā)送GET請求
print(r.data.decode('utf-8')) # 打印返回內(nèi)容
🦋5.2 設(shè)置超時
- 兩種設(shè)置方式:
- 全局設(shè)置:在
PoolManager
對象初始化時指定timeout
。 - 單次請求設(shè)置:在
request()
方法中直接傳遞timeout
。
- 全局設(shè)置:在
- 精確控制:使用
Timeout
類分別設(shè)置連接超時和讀取超時。
示例:基礎(chǔ)超時設(shè)置
import urllib3 # 導入urllib3模塊
urllib3.disable_warnings() # 關(guān)閉ssl警告
baidu_url = 'https://www.baidu.com/' # 百度超時請求測試地址
python_url = 'https://www.python.org/' # Python超時請求測試地址
http = urllib3.PoolManager() # 創(chuàng)建連接池管理對象
try:r = http.request('GET',baidu_url,timeout=0.01)# 發(fā)送GET請求,并設(shè)置超時時間為0.01秒
except Exception as error:print('百度超時:',error)
http2 = urllib3.PoolManager(timeout=0.1) # 創(chuàng)建連接池管理對象,并設(shè)置超時時間為0.1秒
try:r = http2.request('GET', python_url) # 發(fā)送GET請求
except Exception as error:print('Python超時:',error)
示例:精確超時控制
from urllib3 import Timeout
import urllib3 # 導入urllib3模塊
urllib3.disable_warnings()
# 設(shè)置連接超時 0.5秒,讀取超時 0.1秒
timeout = Timeout(connect=0.5, read=0.1)# 方式1:全局設(shè)置
http = urllib3.PoolManager(timeout=timeout)
http.request("GET", "https://www.python.org")# 方式2:單次請求設(shè)置
http = urllib3.PoolManager()
http.request("GET", "https://www.python.org", timeout=timeout)
🦋5.3 設(shè)置代理
- 核心類:
ProxyManager
,需指定代理地址和請求頭。 - 作用:隱藏真實 IP 或訪問受限制資源。
示例:通過代理發(fā)送請求
import urllib3 # 導入urllib3模塊
url = "http://httpbin.org/ip" # 代理IP請求測試地址
# 定義火狐瀏覽器請求頭信息
headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:77.0) Gecko/20100101 Firefox/77.0'}
# 創(chuàng)建代理管理對象
proxy = urllib3.ProxyManager('http://120.27.110.143:80',headers = headers)
r = proxy.request('get',url,timeout=2.0) # 發(fā)送請求
print(r.data.decode()) # 打印返回結(jié)果
輸出:
{"origin": "120.27.110.143"
}
🔎6.上傳文件
- 兩種方式:
- 文本文件:通過
fields
參數(shù)以元組形式傳遞。 - 二進制文件:通過
body
參數(shù)直接傳遞數(shù)據(jù),并指定Content-Type
。
- 文本文件:通過
示例:上傳文本文件
import urllib3 # 導入urllib3模塊
import json # 導入json模塊
with open('test.txt') as f: # 打開文本文件data = f.read() # 讀取文件
http = urllib3.PoolManager() # 創(chuàng)建連接池管理對象
# 發(fā)送網(wǎng)絡(luò)請求
r = http.request( 'POST','http://httpbin.org/post',fields={'filefield': ('example.txt', data),})
files = json.loads(r.data.decode('utf-8'))['files'] # 獲取上傳文件內(nèi)容
print(files) # 打印上傳文本信息
輸出:
{"filefield": "在學習中尋找快樂!"
}
示例:上傳圖片文件
import urllib3 # 導入urllib3模塊
with open('python.jpg','rb') as f: # 打開圖片文件data = f.read() # 讀取文件
http = urllib3.PoolManager() # 創(chuàng)建連接池管理對象
# 發(fā)送請求
r = http.request('POST','http://httpbin.org/post',body = data,headers={'Content-Type':'image/jpeg'})
print(r.data.decode()) # 打印返回結(jié)果