ganon库实战--根据class抓取京东价格和图片

来源:互联网 发布:人工智能 医疗机器人 编辑:程序博客网 时间:2024/06/02 18:54

前言

最近有个小需求,希望能根据京东商品页面抓取到对应的价格和商品图片,我们都知道有很多专业开源爬虫库。这次尝试体验了ganon库,简单好用,推荐值得一试。
特点是可以类似css类选择器那样选择元素,如要选择class="big-price"的span元素:span[class="big-price"。选中元素后可以获取到自己所需的内容。基本就等同于js操作html元素。
官网: (https://code.google.com/archive/p/ganon//)

实战目标

获取地址中的图片和价格 这里写图片描述

源码:

<?phpinclude 'ganon.php';$html = file_get_dom("http://item.m.jd.com/product/10875285.html");$pic = [];// $price = '';foreach ($html('span[class="big-price"]') as $element) {$price = ($element->getInnerText());}foreach ($html('span[class="small-price"]') as $element) {$price .= ($element->getInnerText());}var_dump($price);foreach ($html('img[class="J_ping"]') as $element) {$pic[] = 'http:'.trim($element->attributes['src']);}var_dump($pic);

执行结果:

$ php test.php string(6) "101.10"array(1) {  [0]=>  string(81) "http://m.360buyimg.com/n12/15093/2a690799-c814-4784-9027-b21e688415ff.jpg!q70.jpg"}

轻轻松松完美搞定!

1 0