找回密码
  注册[Register]
查看: 1105|回复: 7

[经验分享] 又一个爬取小姐姐图片的爬虫

  [复制链接]
发表于 2020-7-28 12:30 | 显示全部楼层 |阅读模式
禁止求评分、诱导评分、互刷评分、互刷悬赏值,违规者封号处理。
禁止发布推广、邀请码、邀请链接、二维码或者有利益相关的任何推广行为。
所有非原创软件请发布在【精品软件区】,发帖必须按照本版块版规格式发帖。

附上源码,解释在下面的代码中


  1. import requests
  2. import parsel
  3. import time
  4. import os
  5. for page in range(1,17): #做一个从1到16的循环
  6.     print("----------正在保存第{}页-----------".format(page))
  7.     url = 'https://xn--wcsw84dcxi8ta.xyz/list_7_{}.html'.format(page)#从第一页到第十六页
  8.     #请求头
  9.     headers={'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.163 Safari/537.36'}

  10.     response=requests.get(url=url,headers=headers).text
  11.     #print(response)
  12.     parse=parsel.Selector(response)
  13.     #用xpath找到我们需要的链接
  14.     data_list=parse.xpath('//div[@id="page-content"]/div/ul/li/a/@href').getall()
  15.     #print(data_list)
  16.     url_1='https://xn--wcsw84dcxi8ta.xyz/'
  17.     #合并我们的图片链接
  18.     data=[url_1+i for i in data_list]
  19.     #print(data)
  20.     page_1=str(page)
  21.     if not os.path.exists('img_1'):#判断是否创建了img_1文件夹
  22.         os.makedirs('img_1')
  23.     if not os.path.exists('img_1\\'+page_1): #判断是否创建page_1文件夹
  24.             os.mkdir('img_1\\'+page_1)
  25.     for img_url in data:
  26.         file_name = img_url.split('_')[-2]+'.jpg'
  27.         response_1=requests.get(url=img_url,headers=headers).content
  28.         #保存文件
  29.         with open('img_1\\'+page_1+'\\'+file_name,'wb')as f:
  30.             f.write(response_1)
  31.     #每次翻页都过8秒在运行,以免对面服务器爆了,也以免封我们的ip
  32.     time.sleep(8)
复制代码


如何回报帮助你解决问题的坛友,一个好办法就是给对方加【热心值】和【牛币】,加分不会扣除自己的积分,做一个热心并受欢迎的人!
发表于 2020-7-28 12:38 | 显示全部楼层
6666666666
如何回报帮助你解决问题的坛友,一个好办法就是给对方加【热心值】和【牛币】,加分不会扣除自己的积分,做一个热心并受欢迎的人!
回复 有用 没用

使用道具 举报

发表于 2020-7-28 12:43 | 显示全部楼层
谢谢大佬
如何回报帮助你解决问题的坛友,一个好办法就是给对方加【热心值】和【牛币】,加分不会扣除自己的积分,做一个热心并受欢迎的人!
回复 有用 没用

使用道具 举报

发表于 2020-7-28 12:53 | 显示全部楼层
6666
如何回报帮助你解决问题的坛友,一个好办法就是给对方加【热心值】和【牛币】,加分不会扣除自己的积分,做一个热心并受欢迎的人!
回复 有用 没用

使用道具 举报

发表于 2020-7-28 13:13 | 显示全部楼层
感谢楼主分享
如何回报帮助你解决问题的坛友,一个好办法就是给对方加【热心值】和【牛币】,加分不会扣除自己的积分,做一个热心并受欢迎的人!
回复 有用 没用

使用道具 举报

发表于 2020-7-28 13:14 | 显示全部楼层
谢谢分享
如何回报帮助你解决问题的坛友,一个好办法就是给对方加【热心值】和【牛币】,加分不会扣除自己的积分,做一个热心并受欢迎的人!
回复 有用 没用

使用道具 举报

发表于 2020-7-28 13:22 | 显示全部楼层
好的,非常感谢
如何回报帮助你解决问题的坛友,一个好办法就是给对方加【热心值】和【牛币】,加分不会扣除自己的积分,做一个热心并受欢迎的人!
回复 有用 没用

使用道具 举报

发表于 2020-7-28 13:40 | 显示全部楼层
谢谢大牛
如何回报帮助你解决问题的坛友,一个好办法就是给对方加【热心值】和【牛币】,加分不会扣除自己的积分,做一个热心并受欢迎的人!
回复 有用 没用

使用道具 举报

您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

RSS订阅|手机版|小黑屋|广告投放|大牛论坛

GMT+8, 2024-5-15 03:42 , Processed in 0.045058 second(s), 17 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表