• 高性能

    支持多线并发爬取。同时,你可以轻易把爬取、解析、存储的逻辑分离,针对不同的步骤进行优化。

  • 支持 XPath、CSS选择器解析

    无需撰写复杂、难以维护的正则表达式匹配内容

  • 简单、易上手

    没有复杂的概念。并有清晰的文档和示例,手把手教你快速上手。

  • 更多功能

    支持断点续爬、失败重试、代理、并有完善的爬取日志

    $xcrawler = new XCrawler([
        'name' => 'demo',
        'requests' => function() {
            $url = 'http://www.demo.com/';
            yield $url;
        },
        'success' => function($result, $request) {
            $crawler = new Crawler();
            $crawler->addHtmlContent($result);
    
            $title = $crawler->filter('title')->html();
            echo $title;
        }
    ]);
    
    $xcrawler->run();