2. 下载每一集漫画

获取到漫画ID后，我们可以进行下载，首先打开漫画阅读界面，再开网络调试，选XHR

一个叫做 ’GetImageIndex‘的请求可以引起我们的注意。

这个请求接受ep_id 也就是这一集的id，返回每一张图片的url，通过这个api，我们可以轻易下载每一张图片，再加入多线程下载，即可实现批量下载啦！

如果喜欢这个程序，就点个star吧！

# 获取章节链接和章节名称 hrefs = re.findall('<li>\n.*?<a href="(.*?\.html)\"\n.*?class="">\n.*?<span>(.*?)</span>',r.text) for href in hrefs: # 拼接章节链接 chapter_url = 'http://w {"code":0,"msg":"","data":[{"url":"https://is.hdslb.com/bfs/manga/075f3b41cd84dc892b04cdb1443d73b6d71adfe9.jpg","token":"73441250b03e3f16%3AMl6hWKE0Ld68N8W%2Bkc%2... 哔哩哔哩（英文名称： bilibili ，简称B站）现为国内领先的年轻人文化社区，该网站于2009年6月26日创建，被粉丝们亲切的称为“B站”。 B站的特色是悬浮于视频上方的实时评论功能，爱好者称其为“弹幕”，这种独特的视频体验让基于互联网的弹幕能够超越时空限制，构建出一种奇妙的共时性的关系，形成一种虚拟的部落式观影氛围，让B站成为极具互动分享和二次创造的文化社区。B站目前也是众多网络热门词汇的发源地之一。大家都知道B站的动漫资源可是十分丰富的，而且大多年轻人都喜欢看动漫，所以这次就从B站爬取了20部比较 python 爬虫可以获取很多想要的资源，那么作为一个动漫的爱好者，除了看动画之外，追漫画才能算是真正的真爱粉。那么，如何使用 python 爬虫我们想要的漫画呢？ python 爬虫首先，我们要使用 python 爬虫的网站就是腾讯动漫网了，实现 python 爬虫的第一步，我们来分析下这个页面的结构。 python 爬虫我们在一个漫画图片上右键，选择审查元素(可以快速定位)，然后我们看到这一部部的漫画被组织在一个个... 可以看到形如***.jpg@1100w...token=***&ts=***的URL，并且该URL返回为图片形式，也就是我们想要的。继续查看其请求类型和参数。可以看到请求类型为GET, 请求参数为 token 爬取哔哩哔哩每周必看栏目动画本次内容为爬取哔哩哔哩每周必看栏目动画，灵感来自于一位博主的评论，问能否爬取B站历史排行榜信息，便决定一试，不过B站上的排行耪都是动态更新的，因此没有头绪，自我感觉不能爬取历史排行榜信息！不过看到了一个栏目倒是有历史的信息，即图中每周必看栏目，每周五定期更新，目前已更到94期，瞬间觉着是个不错的较有挑战的例子，便打算试上一试！于是乎~便有了本篇文章，详情如下一、爬取过程在爬取过程中，小编开始采用之前惯用的爬取方式，发现爬取的内容不是需要的数据，每次打开B站首页的源代码，找到相关内容。这里我获取的是圈红的那个部分的视频找视频的标题和超链接的内容，超链接里面的末尾数字就是视频的id号 1. 上代码，找到目标... 没钱看正版漫画，盗版漫画网站只能左右翻页，没法上下滚动观看且广告多体验差？于是我写了个 python 爬虫。手机上无论是收费还是免费盗版的漫画都有各种各样的app可供选择，正版的像是腾讯动漫，哔哩哔哩漫画，菠萝包等等，免费的比如动漫之家，免费搜书大全阅读器等等。（说是搜书其实也能看漫画，本质就是一个爬虫）；而且阅读的体验也都很不错，且大部分时候也都是在手机上阅读。但当我心血来潮在笔记本上看盗版漫画（穷学生一个）的时候发现很多的盗版漫画网站只有左右翻页观看，翻页很累，而且图片老大一张，网站又没有漫画图片大小调整 #!/usr/bin/ python # -*- coding: utf-8 -*-import reimport requests''' 分析： 1. 爬取流程地址：https://search. bilibili .com/all?keyword=%E5%A5%B3%E7%A5%9E%E7%AF%87&from_source=banner_search&page=3... 首先打开https://www. bilibili .com/v/anime/serial/#/按F12进行抓包，找到返回JSON数据的URL。用心你就可以找到这样一条URL 里面的JSON数据和页面显示的一致，请求这条URL（使用JSON views插件），这时会弹出访问请求遭到拒绝的提示，只需将&jsonp=jsonp……后面都删掉即可。这时结构就非常明了了，arc 所有的漫画章节链接都在一个页面中全部被包含。1个<li>包含5个<pi>,1个<pi>包含4个<span>,1个<span>中存储一个章节。所以1个<li>对应腾讯漫画每20个一组的分组...