简介
网络爬虫是当今获取数据不可或缺的重要手段。本书讲解了Python爬虫的基础知识和必备技能,帮助零基础的读者快速入门并熟练使用爬虫。全书共8章。第1章讲解Python开发环境的安装与配置以及Python的基础语法知识。第2章讲解如何运用Requests库和Selenium库获取网页源代码。第3章讲解如何运用正则表达式和BeautifulSoup库解析和提取数据。第4章深入讲解Selenium库在商业实战中的进阶应用。第5章讲解爬虫数据的处理与可视化。第6章讲解爬虫数据结构化神器pandas库,以及如何通过Python在MySQL数据库中读写数据。第7章讲解如何运用多线程和多进程技术提高爬虫效率。第8章讲解如何运用IP代理应对网站的反爬机制。本书对于编程新手来说非常友好,从Python基础到爬虫原理再到实战应用,循序渐进地帮助读者打好基础。对于有一定Python爬虫基础的读者,本书也针对实战中常见的疑点和难点提供了解决技巧。