Python 3反爬虫原理与绕过实战

本网站不提供下载链接,喜欢看书的朋友请关注公众号:【lennylee的碎碎念】(lennyleede),首页回复:授人以渔,自动获取搜索资源的方法。

内容简介:

本书首先介绍了开发环境的配置,接着讨论了Web网站的构成和页面渲染、动态网页和静态网页对爬虫造成的影响,紧接着详细介绍了信息校验型反爬虫、动态渲染反爬虫、文本混淆反爬虫知识、特征识别反爬虫的原理、实现和绕过,然后概览了App数据爬取的关键和常用的反爬虫手段,最后介绍了常见的编码和加密原理、JavaScript代码混淆知识、前端禁止事件以及与爬虫相关的法律知识和风险点。

作者简介:

韦世东,资深爬虫工程师,2019年华为云·云享专家,掘金社区优秀作者,GitChat认证作者,夜幕团队(NightTeam)成员。拥有七年互联网从业经验,擅长反爬虫的设计和绕过技巧。


前言
第1章 开发环境配置
第2章 Web网站的构成和页面渲染
第3章 爬虫与反爬虫
第4章 信息校验型反爬虫
第5章 动态渲染反爬虫
第6章 文本混淆反爬虫
第7章 特征识别反爬虫
第8章 App反爬虫
第9章 验证码
第10章 综合知识
· · · · · · (收起)

原文摘录: