概述 · phpspider 开发文档
Excerpt
《我用爬虫一天时间“偷了”知乎一百万用户,只为证明 PHP 是世界上最好的语言 》所使用的程序框架
PHP 蜘蛛爬虫开发文档
《我用爬虫一天时间“偷了”知乎一百万用户,只为证明 PHP 是世界上最好的语言 》所使用的程序框架
编写 PHP 网络爬虫, 需要具备以下技能:
- 爬虫采用 PHP 编写
- 从网页中抽取数据需要用 XPath ( XPath 选择器教程 )
- 当然我们还可以使用 CSS 选择器 ( CSS 选择器教程 )
- 很多情况下都会用到正则表达式 ( 正则表达式教程 )
- Chrome 的开发者工具是神器, 很多 AJAX 请求需要用它来分析
注意:本框架只能在命令行下运行,命令行、命令行、命令行,重要的事情说三遍 ^_^