利用爬虫代码美女写真套图下载转PDF保存

发布时间：2025-11-08 06:14:21 作者：玩站小弟

英雄联盟科技加速辅助利用爬虫代码美女写真套图下载转PDF保存爬的不是全站链接，该爬虫爬的是每套图的链接，相当于是详情页的链接需要单独下载的python库requestsfake_useragentxpathPIL下面有图片打码是为了过审，这网站真的是正经的写。

爬的利用不是全站链接，该爬虫爬的爬虫英雄联盟科技工具免费网站是每套图的链接，相当于是代码英雄联盟科技卡盟加速器站详情页的链接

需要单独下载的python库

requests

fake_useragent

xpath

PIL

下面有图片打码是为了过审，这网站真的美女英雄联盟科技工具官网版网是正经的写真网站不是什么老司机网站

import requests from fake_useragent import UserAgent from lxml import etree import os import aiohttp import asyncio from PIL import Image import shutil #获取详情页全部图片函数 async def get_xq(url): #计数 p=0 tasks = [] res = requests.get(url=url,headers=header) res.encoding="utf-8" res.close() tree = etree.HTML(res.text) #图片标题 imgtitle = tree.xpath(//title/text())[0] global title title = imgtitle #第一页的图片链接 img = tree.xpath(//article//img/@src) imgurl = ["https://www.xgyw01.co" + i for i in img] print("当前下载的套图标题:\n"+imgtitle) for i in imgurl: p += 1 tasks.append(down(i,imgtitle,p)) #获取下一页的链接 next = "https://www.xgyw01.co" + tree.xpath(//div[@class="pagination"][1]//a[last()]/@href)[0] #判断的条件 bool = tree.xpath(//div[@class="pagination"][1]//a[last()]/text())[0] #循环获取所有页 while True: print("正在获取"+next) if bool == "下一页" or bool == "下页": res = requests.get(url=next, headers=header) res.encoding = "utf-8" res.close() tree = etree.HTML(res.text) img = tree.xpath(//article//img/@src) imgurl = ["https://www.xgyw01.co" + i for i in img] for i in imgurl: p += 1 tasks.append(down(i,imgtitle,p)) #判断的条件 bool = tree.xpath(//div[@class="pagination"][1]//a[last()]/text())[0] if bool == "下一页" or 本尊科技bool == "下页": next = "https://www.xgyw01.co" + tree.xpath(//div[@class="pagination"][1]//a[last()]/@href)[0] continue else: break else: break print("开始异步下载图片.....") await asyncio.wait(tasks) #下载函数 async def down(url,filename,fn): filepath = os.path.join(dirdz,filename) if not os.path.exists(filepath): os.mkdir(filepath) async with aiohttp.ClientSession() as session: async with session.get(url) as res: with open(filepath+"/"+str(fn)+".jpg",mode="wb") as f: f.write(await res.content.read()) print(f"第{fn}张下载完成") #写真图片转PDF函数 def jpg_pdf(filename): # 定义文件夹路径和PDF文件名 folder_path = os.path.join(dirdz,filename) pdf_filename = os.path.join(dirdz,filename + ".pdf") # # 将JPEG文件转换为Pillow Image对象并添加到列表中 image_files = [os.path.join(folder_path, f) for f in os.listdir(folder_path) if f.endswith(.jpeg) or f.endswith(.jpg)] image_list = [] for file_path in image_files: img = Image.open(os.path.abspath(file_path)) image_list.append(img) # 找到所有JPEG文件 image_list[0].save(pdf_filename, "PDF" ,resolution=100.0, save_all=True, append_images=image_list[1:]) print("pdf合并完成,删除缓存的的图片") shutil.rmtree(folder_path) print("清理完成") #主函数 if __name__ == __main__: #定义的公共请求头 header = {"user-agent": UserAgent().random} #定义的保存路径（文件夹路径） dirdz = "这里输入保存的文件夹路径" #定义一个全局的标题保存文件名字 title = "" #爬取的网站是:https://www.xgyw01.co/ ，找到想下的写真下载英雄联盟科技外挂最新网站套图直接点进去复制详情页的链接就行了 url = input("请输入套图详情页链接:") #使用异常捕获排除异常 try: #因为是异步函数所以需要用asyncio.run启动 asyncio.run(get_xq(url)) print(title) except: print("链接详情页解析错误.........") print("全部下载完成,开始生成pdf.......") #调用图片转PDF函数 jpg_pdf(title)

Tag：英雄联盟科技外挂最新网站英雄联盟科技工具官网网英雄联盟科技漂移科技英雄联盟科技卡盟科技网站英雄联盟科技卡盟加速器英雄联盟科技外挂官网站英雄联盟卡网加速器站英雄联盟科技外挂最新版网英雄联盟科技工具最新站

大学校园闲置物品出售交易平台源码二手交易源码
源码简介大学校园闲置物品出售交易平台源码，二手交易源码。jsp+ssmspring+springMVC+mybaits）+mysql实现的校园二手市场交易平台，前台主要实现的功能有：按分类显示商品列
2025-11-08
真实拳击存档最新版
真实拳击存档最新版是各位懒人当玩家们的福音，它可以为玩家在游戏真实拳击中带来满级属性人物玩，家们使用这款存档进入游戏可以获得人物属性全满的场面，玩家在游戏中选择多样，喜欢的玩家们快来试试这款游戏吧。真
2025-11-08
征战霸业官网版
征战霸业官网版是一款热血传奇对战的游戏，这里的主要玩法还是很考验玩家们的运气的，想要什么爆率就看您的选择了，游戏中玩家可以自由的组队，重回玛法征战天下，新版本职业角色等你来练级，赶快来下载吧。征战霸业
2025-11-08
暗区老鼠教程
装备选择、实战技巧以及一些进阶思路。先通过一个表格快速了解"老鼠人"玩法的核心思路：特点传统刚枪玩法 "老鼠人"玩法装备目标高级护甲、高级子弹、满改枪械低成本装备通常≤2万柯恩币），伪装成普通A
2025-11-08
有道云笔记永久直链解析接口源码
源码简介有道云笔记是一款广受欢迎的云笔记工具，可以将笔记保存在云端，随时随地进行查看和编辑。但是，在使用有道云笔记时，用户发现其文件下载直链为临时链接，仅在一定时间内有效，不便于长期使用。因此，有道云
2025-11-08
放置奇兵手游九游版
放置奇兵九游版是一款备受玩家喜爱的角色扮演类手游巨制，各种细节都做得非常优秀，玩家要培养你的英雄小队为正义而战，带领你的英雄小队深入古老的废墟，以简单的操作，游戏中的玩法十分的丰富，喜欢这款游戏的朋友
2025-11-08

百科

焦点

休闲

娱乐

综合

探索

时尚

知识

利用爬虫代码美女写真套图下载转PDF保存

相关文章

最新评论

文章分类

大家感兴趣的内容

最近更新的内容

友情链接