架构师

您现在的位置是:首页 > 程序人生 > 网络爬虫

网络爬虫

webmagic使用css选择器案例

架构师小跟班 2020-07-18 网络爬虫
//获取h2标签内容page.putField("title1", page.getHtml().css("div.main h2").all());//获取h2标签的文本内容page.putField("title2", page.getHtml().css("div.main h2",
//获取h2标签内容
page.putField("title1", page.getHtml().css("div.main h2").all());
//获取h2标签的文本内容
page.putField("title2", page.getHtml().css("div.main h2","text").all());
//获取img标签的src链接
page.putField("pic",page.getHtml().css("img.mask_img1","src").all());
//获取a标签的href属性
page.putField("url",page.getHtml().css("div.main ul li").css("a","href").all());

结果:


文章评论