好书介绍-PHP爬虫

如果您真的想学PHP/cURL网络采集,那这里有几本您不可错过的书籍。当然,您也可以从网上找到相关的资料如 Stack Overflow, GitHub 等...

我手头有好几本网络采集书籍,有三本是用PHP/cURL编程,如您想要学,可从这三本书学起。

Webbots, Spiders and Screen Scrapers - 作者Michael Schrenk

 

Webbots, Spiders and Screen Scrapers - 作者Michael Schrenk。 这本书现已出第二版。2010年我在纪伊国屋书店找到繁体中文版,正是我急需网络采集实战例子之时。

这本书较为全面,内容浅显易懂, 细致透彻解释基本概念,高级技术,法律层面,各种应用,问题等等,是可令人读到津津有味的一本书。我也曾用书中的库函数编写我的PHP网络蜘蛛. 新人可从这本书下手。

Web Scraping for PHP Developers - 作者Sameer Borate

 

Web Scraping for PHP Developers - 作者Sameer Borate,刚在2013年七月发行。笔者使用PHP/cURL从服务器请求网页源文件,然后使用SimpleHTML DOM进行采集。书中还讨论认证,正则表达式,PhantomJS等, 并提供实战例子。

Instant PHP Web Scraping - 作者 Jacob Ward

Instant PHP Web Scraping - 作者 Jacob Ward ,也在2013年七月发行。 书中使用PHP /cURL从服务器请求网页源文件,然后使用XPath元素采集。

 

最后修改于 星期四, 03 11月 2016 06:41
给本项目评分
(0 得票数)
返回顶部