中文亚洲精品无码_熟女乱子伦免费_人人超碰人人爱国产_亚洲熟妇女综合网

當前位置: 首頁 > news >正文

蘇州網(wǎng)站建設科技有限公司html網(wǎng)頁制作

蘇州網(wǎng)站建設科技有限公司,html網(wǎng)頁制作,精品課程網(wǎng)站建設驗收單,北京免費網(wǎng)站建設模板創(chuàng)建crawlspider爬蟲文件: scrapy genspider -t crawl 爬蟲文件名 爬取的域名scrapy genspider -t crawl read https://www.dushu.com/book/1206.htmlLinkExtractor 鏈接提取器通過它,Spider可以知道從爬取的頁面中提取出哪些鏈接,提取出的鏈…

創(chuàng)建crawlspider爬蟲文件:

scrapy genspider -t crawl 爬蟲文件名 爬取的域名scrapy genspider -t crawl read https://www.dushu.com/book/1206.html

LinkExtractor 鏈接提取器通過它,Spider可以知道從爬取的頁面中提取出哪些鏈接,提取出的鏈接會自動生成Request請求對象

class ReadSpider(CrawlSpider):name = "read"allowed_domains = ["www.dushu.com"]start_urls = ["https://www.dushu.com/book/1206_1.html"]# LinkExtractor 鏈接提取器通過它,Spider可以知道從爬取的頁面中提取出哪些鏈接。提取出的鏈接會自動生成Request請求對象rules = (Rule(LinkExtractor(allow=r"/book/1206_\d+\.html"), callback="parse_item", follow=False),)def parse_item(self, response):name_list = response.xpath('//div[@class="book-info"]//img/@alt')src_list = response.xpath('//div[@class="book-info"]//img/@data-original')for i in range(len(name_list)):name = name_list[i].extract()src = src_list[i].extract()book = ScarpyReadbook41Item(name=name, src=src)yield book

開啟管道、
寫入文件

class ScarpyReadbook41Pipeline:def open_spider(self, spider):self.fp = open('books.json', 'w', encoding='utf-8')def process_item(self, item, spider):self.fp.write(str(item))return itemdef close_spider(self, spider):self.fp.close()

運行之后發(fā)現(xiàn)沒有第一頁數(shù)據(jù)
需要在start_urls里加上_1,不然不會讀取第一頁數(shù)據(jù)

start_urls = ["https://www.dushu.com/book/1206_1.html"]
http://www.risenshineclean.com/news/60124.html

相關文章:

  • 上海做設計公司網(wǎng)站疫情最新政策最新消息
  • vs 2008網(wǎng)站做安裝包太原seo公司
  • 日本做受視頻網(wǎng)站互聯(lián)網(wǎng)廣告代理商
  • 校園網(wǎng)站如何建立網(wǎng)站關鍵詞排名優(yōu)化方法
  • 鄭州東區(qū)做網(wǎng)站的公司蘋果自研搜索引擎或為替代谷歌
  • 行政部建設公司網(wǎng)站值得收藏的五個搜索引擎
  • 網(wǎng)站維護 收錄湖南長沙最新疫情
  • 自己做網(wǎng)站系統(tǒng)首選平臺域名解析ip地址
  • 模板網(wǎng)站建設優(yōu)惠青島seo
  • 福建省建筑信息平臺上海怎么做seo推廣
  • 網(wǎng)站怎么做二級頁面寧波seo托管公司
  • 抽獎的網(wǎng)站怎么做今日熱搜榜前十名
  • 網(wǎng)站建設與網(wǎng)頁制作教程流程優(yōu)化四個方法
  • 個人網(wǎng)站做重定向圖片網(wǎng)站怎么添加外鏈
  • 蕪湖市網(wǎng)站建設站長工具外鏈查詢
  • 永久免費網(wǎng)站空間北京突發(fā)重大消息
  • wordpress頁面都在seo軟件資源
  • 開發(fā)公司英文企業(yè)站seo
  • javascript做網(wǎng)站重要嗎網(wǎng)絡營銷公司網(wǎng)絡推廣
  • 如何建設數(shù)據(jù)庫搜索網(wǎng)站常用搜索引擎有哪些
  • 南寧seo網(wǎng)站排名優(yōu)化公司百度愛采購官方網(wǎng)站
  • 如何在360做網(wǎng)站SEO百度引流推廣費用多少
  • 做花生的網(wǎng)站江蘇做網(wǎng)站的公司有哪些
  • 淘寶網(wǎng)站代理怎么做的網(wǎng)站服務器ip查詢
  • wordpress如何設置在某一分類目錄下的文章都顯示特定小工具seo關鍵詞排名優(yōu)化推薦
  • 獨立站有哪些常見平臺手機制作網(wǎng)站的軟件
  • web開發(fā)不只是做網(wǎng)站企業(yè)網(wǎng)站建設流程
  • 網(wǎng)站超級推廣seo單詞優(yōu)化
  • 免費建立手機網(wǎng)站嗎長沙sem培訓
  • 學校網(wǎng)站logo怎么做推廣平臺都有哪些