找回密码
  注册[Register]
查看: 1229|回复: 10

[windows] 自学Python写了个彼岸图片爬虫,给大家分享一下---再分享一个经常看见的动漫爬虫

[复制链接]
发表于 2021-3-13 22:39 | 显示全部楼层 |阅读模式
禁止求评分、诱导评分、互刷评分、互刷悬赏值,违规者封号处理。
禁止发布推广、邀请码、邀请链接、二维码或者有利益相关的任何推广行为。
所有非原创软件请发布在【精品软件区】,发帖必须按照本版块版规格式发帖。

爬虫真好玩,本来按照教学爬淘宝图片的,可是我怎么都找不到图片地址在源码什么地方,无意看到彼岸的小姐姐图片,牛牛都受不了了,研究半天写了个爬虫,只爬取动漫的,现在把源码分享给大家,写的可能不是很好,望体谅哈。
照片感觉只是720p的 谁教教我怎么弄4K的照片啊
https://pic.netbian.com/4kdongman/index.html这个就是网址,里面的拼音有个动漫,就是动漫分类了,大家也可以换成风景那些,估计都一样
for i in range(0,10)这个是爬的页数,只有10页,可以自己修改哈
dd='C:\\Users\\86185\\Desktop\\22\\'+str(a)+'.jpg'这个是保存地址  C:\\Users\\86185\\Desktop\\22只需要把这一段换成自己想保存的电脑路径。



import urllib.request,re,random
btk=[
    'Mozilla/5.0 (Macintosh; U; Intel Mac OS X 10_6_8; en-us) AppleWebKit/534.50 (KHTML, like Gecko) Version/5.1 Safari/534.50',
    'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-us) AppleWebKit/534.50 (KHTML, like Gecko) Version/5.1 Safari/534.50',
    'Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; Trident/5.0)',
    'Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.0; Trident/4.0)',
    'Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.0)',

def ua(btk):
    thisua=random.choice(btk)
    headers=('User-Agent',thisua)
    opener=urllib.request.build_opener()
    opener.addheaders=[headers
    urllib.request.install_opener(opener)
try:
    a=0
    for i in range(0,10):
        if i <2:
            url='https://pic.netbian.com/4kdongman/index.html'
        else:
            url='https://pic.netbian.com/4kdongman/index_'+str(i)+'.html'
        ua(btk)
        data=urllib.request.urlopen(url).read().decode('utf-8','ignore')
        pat='</li><li><a href="(.*?)"'
        rst=re.compile(pat).findall(data)
        for j in range(0,len(rst)):
            a+=1
            url1='https://pic.netbian.com'+rst[j
            ua(btk)
            data1=urllib.request.urlopen(url1).read().decode('utf-8','ignore')
            pat1='id="img"><img src="(.*?)"'
            rst1=re.compile(pat1).findall(data1)
            url2='https://pic.netbian.com'+rst1[0
            dd='C:\\Users\\86185\\Desktop\\22\\'+str(a)+'.jpg'
            urllib.request.urlretrieve(url2,filename=dd) #爬取全部东西并且存储
            print(f'当前第{str(a)} 个照片下载成功')            
except urllib.error.URLError as e:
        print (e.code)          #异常状态
        print (e.reason)
--------------------------------------------------------------  分割线,再分享一个爬虫你懂得,记得改存储路径- 11.png 就这个动漫天天在我各大软件出现,兄弟们给我冲------------------------------------------------------------- -------------------------------------------------------------- -------------------------import urllib.request,re,random

btk=[
    'Mozilla/5.0 (Macintosh; U; Intel Mac OS X 10_6_8; en-us) AppleWebKit/534.50 (KHTML, like Gecko) Version/5.1 Safari/534.50',
    'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-us) AppleWebKit/534.50 (KHTML, like Gecko) Version/5.1 Safari/534.50',
    'Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; Trident/5.0)',
    'Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.0; Trident/4.0)',
    'Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.0)',
]
def ua(btk):
    thisua=random.choice(btk)
    headers=('User-Agent',thisua)
    opener=urllib.request.build_opener()
    opener.addheaders=[headers]
    urllib.request.install_opener(opener)
try:
    a=0
    for i in range(0,100):
        url='https://rouman5.com/books/63b65185-f798-4c8f-a0b0-8811615908fd/'+str(i)
        ua(btk)
        data=urllib.request.urlopen(url).read().decode('utf-8','ignore')
        pat='"no-referrer" src="(.*?)"'
        rst=re.compile(pat).findall(data)
        for j in range(len(rst)):
            a+=1
            dd='C:\\Users\\86185\\Desktop\\22\\'+str(j)+'.jpg'                    #记得改存储路径啊
            urllib.request.urlretrieve(rst[j],filename=dd) #爬取全部东西并且存储
            print(f'当前第{str(j)} 个照片下载成功')            
except urllib.error.URLError as e:
        print (e.code)          #异常状态
        print (e.reason)

如何回报帮助你解决问题的坛友,一个好办法就是给对方加【热心值】和【牛币】,加分不会扣除自己的积分,做一个热心并受欢迎的人!
发表于 2021-3-14 00:00 | 显示全部楼层

支持楼主,谢谢分享。
如何回报帮助你解决问题的坛友,一个好办法就是给对方加【热心值】和【牛币】,加分不会扣除自己的积分,做一个热心并受欢迎的人!
回复 有用 没用

使用道具 举报

发表于 2021-3-14 01:07 | 显示全部楼层
6666
如何回报帮助你解决问题的坛友,一个好办法就是给对方加【热心值】和【牛币】,加分不会扣除自己的积分,做一个热心并受欢迎的人!
回复 有用 没用

使用道具 举报

发表于 2021-3-14 01:17 | 显示全部楼层

感谢分享,谢谢提供分享
如何回报帮助你解决问题的坛友,一个好办法就是给对方加【热心值】和【牛币】,加分不会扣除自己的积分,做一个热心并受欢迎的人!
回复 有用 没用

使用道具 举报

发表于 2021-3-14 01:31 | 显示全部楼层
感谢楼主分享
如何回报帮助你解决问题的坛友,一个好办法就是给对方加【热心值】和【牛币】,加分不会扣除自己的积分,做一个热心并受欢迎的人!
回复 有用 没用

使用道具 举报

发表于 2021-3-14 01:52 | 显示全部楼层
多谢分享多谢分享
如何回报帮助你解决问题的坛友,一个好办法就是给对方加【热心值】和【牛币】,加分不会扣除自己的积分,做一个热心并受欢迎的人!
回复 有用 没用

使用道具 举报

发表于 2021-3-14 02:48 | 显示全部楼层
多谢楼主分享
如何回报帮助你解决问题的坛友,一个好办法就是给对方加【热心值】和【牛币】,加分不会扣除自己的积分,做一个热心并受欢迎的人!
回复 有用 没用

使用道具 举报

发表于 2021-3-14 07:45 | 显示全部楼层
谢谢分享!
如何回报帮助你解决问题的坛友,一个好办法就是给对方加【热心值】和【牛币】,加分不会扣除自己的积分,做一个热心并受欢迎的人!
回复 有用 没用

使用道具 举报

发表于 2021-3-14 07:46 | 显示全部楼层
支持楼主,谢谢分享
如何回报帮助你解决问题的坛友,一个好办法就是给对方加【热心值】和【牛币】,加分不会扣除自己的积分,做一个热心并受欢迎的人!
回复 有用 没用

使用道具 举报

发表于 2021-3-14 07:50 | 显示全部楼层
谢谢大牛
如何回报帮助你解决问题的坛友,一个好办法就是给对方加【热心值】和【牛币】,加分不会扣除自己的积分,做一个热心并受欢迎的人!
回复 有用 没用

使用道具 举报

您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

RSS订阅|手机版|小黑屋|广告投放|大牛论坛

GMT+8, 2024-6-3 03:13 , Processed in 0.045946 second(s), 21 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表