年輕的兒媳seo技術(shù)培訓(xùn)教程視頻
第7期圖書推薦
- 內(nèi)容簡介
- 作者簡介
- 大咖推薦
- 圖書目錄概述
- 參與方式
內(nèi)容簡介
本書介紹了Python3網(wǎng)絡(luò)爬蟲的常見技術(shù)。首先介紹了網(wǎng)頁的基礎(chǔ)知識(shí),然后介紹了urllib
、Requests
請求庫以及XPath
、Beautiful Soup
等解析庫,接著介紹了selenium
對動(dòng)態(tài)網(wǎng)站的爬取和Scrapy
爬蟲框架,最后介紹了Linux基礎(chǔ),便于讀者自主部署編寫好的爬蟲腳本。本書所有代碼和相關(guān)素材可以到GitHub
下載獲取,地址為https://github.com/sfvsfv/Crawer
本書主要面向?qū)W(wǎng)絡(luò)爬蟲感興趣的初學(xué)者。
作者簡介
楊涵文
網(wǎng)名“川川”,現(xiàn)致力于全棧開發(fā)領(lǐng)域,在大數(shù)據(jù)分析與挖掘、機(jī)器學(xué)習(xí)、人工智能、網(wǎng)站開發(fā)等領(lǐng)域?qū)崙?zhàn)經(jīng)驗(yàn)豐富。CSDN內(nèi)容合伙人、阿里云博客專家,全網(wǎng)20萬粉絲博主,熱衷于技術(shù)研究,樂于分享
周培源
網(wǎng)名“不吃西紅柿”,現(xiàn)任Apple高級工程師。全網(wǎng)30萬粉絲的知名技術(shù)博主、CSDN內(nèi)容合伙人、華為HDZ成員、阿里云博客專家
陳姍姍
上海工程技術(shù)大學(xué)講師,理學(xué)博士,西澳大學(xué)聯(lián)培博士,碩士生導(dǎo)師。發(fā)表學(xué)術(shù)論文20余篇,其中SCI檢索10余篇,國際權(quán)威SCI期刊、IEEE等期刊審稿人。參與多項(xiàng)國家自然科學(xué)基金重點(diǎn)項(xiàng)目等
大咖推薦
本書作者“不吃西紅柿”和“川川”都是CSDN創(chuàng)作社區(qū)的優(yōu)秀作者,他們通過持續(xù)創(chuàng)作,帶領(lǐng)眾多粉絲學(xué)習(xí)、參加編程比賽,為粉絲答疑解惑,成為名副其實(shí)的“領(lǐng)軍人物”。這本書就是他們持續(xù)積累、不斷迭代改進(jìn)的結(jié)晶。
——鄒欣CSDN副總裁、《編程之美》 和《構(gòu)建之法》作者
本書從基礎(chǔ)知識(shí)入門到高級實(shí)戰(zhàn)應(yīng)用,內(nèi)容詳盡、案例豐富,是學(xué)習(xí)和提升Python網(wǎng)絡(luò)爬蟲技術(shù)的必備佳作。
——徐濤貝殼執(zhí)行董事兼首席財(cái)務(wù)官
除了介紹Python爬蟲技術(shù)基礎(chǔ)知識(shí),本書還提供了大量的實(shí)戰(zhàn)案例,包括爬取各類網(wǎng)站的文字、圖片和視頻等,可以幫助讀者更好地學(xué)習(xí)和掌握Python爬蟲技術(shù)。我相信,這本書- -定 會(huì)成為Python爬蟲開發(fā)者的必備工具書。
——劉強(qiáng)杭州數(shù)卓信息技術(shù)有限公司CEO、《構(gòu)建企業(yè)級推薦系統(tǒng)》 作者
圖書目錄概述
全書共分為8章,第1章為網(wǎng)頁的內(nèi)容,第2~7章為爬蟲的內(nèi)容,第8章為Linux基礎(chǔ)
。
- 第1章:介紹了HTML和CSS的基礎(chǔ)知識(shí),雖然本章并不是直接與爬蟲相關(guān),但它是學(xué)習(xí)爬蟲技術(shù)的基礎(chǔ)。對于已經(jīng)掌握基本網(wǎng)頁基礎(chǔ)的讀者,可以選擇跳過該章。
- 第2章:正式進(jìn)入爬蟲技術(shù)的學(xué)習(xí)階段,這一章介紹了最基本的兩個(gè)請求庫
urllib和Requests
,有知識(shí)點(diǎn)的講解,也有實(shí)戰(zhàn)案例的講解。 - 第3章:本章對
正則表達(dá)式
做了詳細(xì)的描述,同時(shí)有案例的實(shí)踐。學(xué)完本章就可以掌握最基本的爬蟲技術(shù)了。 - 第4章:主要介紹
XPath
解析庫,配有實(shí)際的案例進(jìn)行講解,以幫助讀者加深理解和鞏固。 - 第5章:主要介紹另一個(gè)解析庫
Beautiful Soup
,它在提取數(shù)據(jù)中也很方便,對相關(guān)知識(shí)點(diǎn)以及實(shí)際的案例都有所講解。XPath和Beautiful Soup可以使信息的提取更加方便、快捷,是爬蟲必備利器。 - 第6章:主要介紹
selenium
自動(dòng)化測試?,F(xiàn)在越來越多的網(wǎng)站內(nèi)容是經(jīng)過 JavaScript 渲染得到的,而原始 HTML 文本可能不包含任何有效內(nèi)容,·使用模塊selenium實(shí)現(xiàn)模擬瀏覽器進(jìn)行數(shù)據(jù)爬取是非常好的選擇。 - 第7章:在大規(guī)模數(shù)據(jù)的爬取中,不太用得上基礎(chǔ)模塊,
Scrapy
是目前使用最廣泛的爬蟲框架之一,本章介紹了Scrapy爬蟲框架的詳細(xì)搭建和實(shí)踐。針對數(shù)據(jù)存儲(chǔ)過程部分使用的MySql數(shù)據(jù)庫,整章有多個(gè)實(shí)際的案例,以幫助讀者加深理解和鞏固。 - 第8章:主要介紹了
Linux
的基礎(chǔ)知識(shí)點(diǎn),以幫助讀者能夠在服務(wù)器部署腳本。
參與方式
本群送書五本:
Python網(wǎng)絡(luò)爬蟲入門到實(shí)戰(zhàn)
關(guān)注博主并點(diǎn)贊收藏加任意評論,隨機(jī)抽取五名免費(fèi)包郵送出
送書截止時(shí)間
:2023年12月7日
京東購買鏈接:https://item.id.com/14049708.html