前言:网络矿工采集教程——车质量数据采集,适合新手。
目标网站:https://www.12365auto.com/zlts/0-0-0-0-0-0_0-0-1.shtml
翻页数量:5251
采集类型:翻页采集数据
第一步:增加采集网址
在网址参数选择【递增变量】起始值1、结束值5251、点击确定。
正确的是:https://www.12365auto.com/zlts/0-0-0-0-0-0_0-0-{Num:1,5251,1}.shtml
第二步:采集数据
点击采集数据,增加。
/body[1]/div[2]/div[4]/div[2]/table[1]/tr[{Num:2,31,1}]/td[2]
填写采集数据名称:投诉品牌
选择可视化配置
点击可视化提取
输入其中一天页数网址:https://www.12365auto.com/zlts/0-0-0-0-0-0_0-0-1.shtml
点击转到
1、点击开始捕获
2、选择多条
3、鼠标单击上海通用雪弗兰
滚动条拉到最后
4、单击之后 xPath表达式会有变化,自动匹配是{Num:2,7,1} 要把7修改成30,一般不需要修改,这里的页面特殊,所以修改,7代表匹配了7条数据,但实际上一页是30条数据。所以要修改成30!
xPath:/body[1]/div[2]/div[4]/div[2]/table[1]/tr[{Num:2,30,1}]/td[2]
然后点击确认退出
点击确定
点击测试
点击启动测试
看到数据列表就代表数据测试成功!后面步骤和之前一样!看下演示: