本书从Python的安装开始,详细讲解了Python从简单程序延伸到Python网络爬虫的全过程。本书从实战出发,根据不同的需求选取不同的爬虫,有针对性地讲解了几种Python网络爬虫。本书共8章,涵盖的内容有Python语言的基本语法、Python常用IDE的使用、Python第三方模块的导入使用、Python爬虫常用模块、Scrapy爬虫、Beautiful
Soup爬虫、Mechanize模拟浏览器和Selenium模拟浏览器。本书所有源代码已上传网盘供读者下载。本书内容丰富,实例典型,实用性强。适合Python网络爬虫初学者、数据分析与挖掘技术初学者,以及高校及培训学校相关专业的师生阅读。
有一半是讲解python基础的,与爬虫无关。后面把流行的包或框架都讲到了,对初学者还是很不错的本书。
用python写网络爬虫 书怎么样
爬虫的重点是在python之外的。确切说是一些前端和部分后端技术(cookie之类的)以及一些http协议相关知识。
而对于python而言,只是获取内容(http请求)和文本处理(抓内容),基本上看俩模块文档看几个框架文档都够用了。
至于更高级的,比如挂phatomjs之类,主要工作都在于js而不是python了。
所以基本上你搜到的买到的教程,大都落伍了,既赶不上前端的发展,也赶不上python模块的演进。
用户登录
还没有账号?立即注册
用户注册
投稿取消
文章分类: |
|
还能输入300字
上传中....