Python3.6.4网络爬虫实战第2版
计算机技术飞速发展,人们对计算机使用技能的要求也越来越高在编写软件时,大家既希望有超高的效率,又希望这门语言简单易用。这种鱼与熊掌皆得的要求的确很高,Python编程语言恰好符合这么苛刻
的要求。Python的执行效率仅比效率之王C略差一筹,在简单易用方面Python也名列三甲。可以说Python在效率和简单之间达到了平衡。另外,Python还是一门胶水语言,可以将其他编程语言的优点融合在一起,达到1+1>2的效果。这也是Python如今使用人数越来越多的原因,Python语言发展迅速,在各行各业都发挥独特的作用。在各大企业、学校、机关都运行着Python明星程序。但就个人而言,运用Python最多的还是网络爬虫(这里的爬虫仅涉及从网页提取数据,不涉及深度、广度算法爬虫搜索)。在网络上经常更新的数据,无须每次都打开网页浏览,使用爬虫程序,一键获取数据,下载保存后分析。考虑到Python爬虫在网络上的资料虽多,但大多都不成系统,难以提供系统有效的学习。因此笔者抛砖引玉,编写了这本有关Python网络爬虫的书,以供读者学习参考。
Python简单易学,Python爬虫也不复杂。只需要了解了Python的基本操作即可自行编写。本书中介绍了几种不同类型的Python爬虫,可以针对不同情况的站点进行数据收集。
本书从Python 3.6.4的安装开始,详细讲解了Python从简单程序延伸到Python网络爬虫的全过程。本书从实战出发,根据不同的需求选取不同的爬虫,有针对性地讲解了几种Python网络爬虫。
本书共10章,涵盖的内容有Python3.6语言的基本语法、Python常用IDE的使用、Pyton第三方模块的导入使用、Python爬虫常用模块、Scrapy爬虫、Beautiful Soup爬虫、Mechanize模拟浏览器和Selenium模拟浏览器、Pyspider爬虫框架、爬虫与反爬虫。本书所有源代码已上传网盘供读者下载。
本书内容丰富,实例典型,实用性强。适合Python网络爬虫初学者、Python数据分析与挖掘技术初学者,以及高等院校和培训学校相关专业的师生阅读。
本书共10章,前面4章简单地介绍了Python 3.6的基本用法和简单Python程序的编写。第5章的Scrapy爬虫框架主要针对一般无须登录的网站,在爬取大量数据时使用Scrapy会很方便。第6章的Beautiful Soup爬虫可以算作爬虫的“个人版”。Beautiful Soup爬虫主要针对一些爬取数据比较少的,结构简单的网站。第7章的Mechanize模块,主要功能是模拟浏览器。它的作用主要是针对那些需要登录验证的网站。第8章的Selenium模块,主要功能也是模拟浏览器,它的作用主要是针对JavaScript返回数据的网站。第9章的Pyspider是由国人自产的爬虫框架Pyspider框架独具一格的Web接口让爬虫的使用更加简单。第10章简单介绍了反爬虫技术,使读者编写的爬虫可以绕过简单的反爬虫技术更加灵活地获取数据。
本书用于Python 3编程与Python 3网络爬虫快速入门。另外,为了让读者多了解几个爬虫框架,本书也介绍了Python 2.7下运行的Mechanize与Pyspider工具。
-
Windows Activation Key Viewer密钥查看器
有时候我们需要知道电脑的密钥方便以后更新激活系统,因为系统激活后是会隐藏密钥的,那么你就需要下载这款电脑密钥查看器(Windows Activa... 1225 0 24-05-31 -
jquery电脑被黑客攻击页面效果
347 0 21-05-17 -
Java 面向对象编程
Java 语言的特点Java应用如此广泛是因为Java具有多方面的优势。其特点如下:(1)面向对象。Java自诞生之时就被设计成面向对象的语言,而C++... 813 0 24-05-28 -
一点明朝体
957 0 24-07-24 -
Apo-AI (GPT4模型) AI人工智能聊天软件
Apo-AI安卓版是一款功能先进的AI人工智能聊天软件APP,Apo-AI付费版借助先进的ChatGРТ4.0模型与Chatbot AI聊天助理提出任何问题并获得即... 946 0 24-12-12 -
jquery实现天猫首页分类导航
501 0 21-06-04 -
在线随机密码生成
在线随机密码生成保护隐私少不了,一站一密码避免被撞库,不满意下面网站的自行使用搜索,关键词“随机密码”avast随机密码生成器:https:/... 607 0 25-03-10 -
PHP保存下载远程文件或图片到本地
<?php $url = "文件地址"; //网络资源的地址 $state = @file_get_contents($url, 0, null, 0, 1); //获取网络资源的字符内容 $filename = r... 793 0 25-04-07
发表我的评论
- 这篇文章还没有收到评论,赶紧来抢沙发吧~