酷笔记 > QueryList采集器开发皇冠体育是干嘛的|免费注册 > 2-3开始使用

开始使用


使用QueyList只需要编写规则库,然后把规则库传给QueryList的静态方法Query,QueryList就会自动按照规则库把内容全部采集回来了,而规则库是用jquery选择器来编写的,所以使用QueryList的整个过程非常简单!

规则库的编写规则如下(简单模式):

$rules?=?array(
???'规则名'?=>?array('jQuery选择器','要采集的属性'),
???'规则名2'?=>?array('jQuery选择器','要采集的属性'),
????..........
);

下面我们来动手试试吧:

  1. 采集目标,下面的代码片段
$HTML?=?<<
???
???????QueryList官网
???????
???????
???
???其它的一些文本
???????? STR;

2.编写采集规则

$rules?=?array(
???//采集id为one这个元素里面的纯文本内容
???'text'?=>?array('#one','text'),
???//采集class为two下面的超链接的链接
???'link'?=>?array('.two>a','href'),
???//采集class为two下面的第二张图片的链接
???'img'?=>?array('.two>img:eq(1)','src'),
???//采集span标签中的HTML内容
???'other'?=>?array('span','html')
);

3.开始采集

$data?=?QueryList::Query($html,$rules)->data;
//打印结果
print_r($data);


结果如下:

Array
(
???[0]?=>?Array
???????(
???????????[text]?=>?
???????QueryList官网
???其它的一些文本
???????????[link]?=>?Http://querylist.cc
???????????[img]?=>?http://querylist.com/2.jpg
???????????[other]?=>?其它的一些文本
???????)
)

如果上面的代码你看懂了,那么恭喜你,你已经成功掌握了QueryList了!

下面是完整代码:

PHP
require?'QueryList/vendor/autoload.php';
use?QL\QueryList;
$html?=?<<
????
????????QueryList官网
????????
????????
????
????其它的一些文本
???????? STR; $rules?=?array( ????//采集id为one这个元素里面的纯文本内容 ????'text'?=>?array('#one','text'), ????//采集class为two下面的超链接的链接 ????'link'?=>?array('.two>a','href'), ????//采集class为two下面的第二张图片的链接 ????'img'?=>?array('.two>img:eq(1)','src'), ????//采集span标签中的HTML内容 ????'other'?=>?array('span','html') ); $data?=?QueryList::Query($html,$rules)->data; print_r($data);
上一篇:
下一篇: