架构师

您现在的位置是:首页 > 程序人生 > 网络爬虫

网络爬虫

爬虫工具xpath helper浏览器插件

架构师小跟班 2020-07-18 网络爬虫
xpath helper下载地址:https://chrome.google.com/webstore/detail/xpath-helper/hgimnogjllphhhkhlmebbmlgjoejdpjl?utm_source=chrome-ntp-icon 使用方法:1)下载安装2)重启浏

xpath helper

下载地址:

https://chrome.google.com/webstore/detail/xpath-helper/hgimnogjllphhhkhlmebbmlgjoejdpjl?utm_source=chrome-ntp-icon

使用方法:

1)下载安装,成功后显示这个图标

2)重启浏览器(必须)

3)先打开目标网页,然后点击“xpath helper”图标,成功后会在网页顶部添加两个黑窗口

4)在想要获取的元素上悬浮鼠标,同时按下shift键。

被选中的元素背景会变黄色,黑窗左侧显示xpath路径,也就是爬虫page.getHtml().xpath()方法里的参数,黑窗右侧是该路径对应的元素内容。

注意li是个数组,如果把[1]去掉,右侧将显示该页所有文章标题。

也可以直接在黑窗左侧写xpath路径,右侧会自动显示匹配到的元素,可以用来验证自己写的xpath是否有误。

文章评论