看php爬虫---小感

来源:互联网 发布:js excel 展示 编辑:程序博客网 时间:2024/06/10 01:46

无意中看到一篇php论坛有关爬虫的文章。

本来因为没学过php,不打算看了。但是最近好多爬虫,所以就看了看。无论程序员能力怎么样,当入门了以后无论是去看还是去学习一门新的语言还是比较容易的。因为都是面向对象,都有函数,只要查查运算符、定义变量、自定义函数等语法的规矩就行了。

我看的那篇关于爬虫的文章是基于:phpspider框架的

所有的网络请求都是建立在链接的情况下:

所以爬虫也是,首先要建立链接就要用到http协议。所以要知道url,parameter。

逻辑就是通过url,使用只有前端更改的逻辑参数。不知道“爬虫”是怎么来的,“爬虫”其实就是一个链接通路,只不过是动态更改前端页面的可更改的逻辑参数,返回信息。

(这是我暂时对爬虫的理解)。

我看的那篇是爬某旅游网的数据的,但是应该也可以不指定某网站的url,使用谷歌搜索,url后面添加你想搜索的参数。

不做赘述(后续写爬虫框架phpspider的原理),直接粘文章地址:http://www.phpchina.com/portal.php?mod=view&aid=40283


0 0
原创粉丝点击