http://mangago.pro/sweetheart-v5-the-boss-is-too-kind/chapter-93
比如批量抓取这个页面上面同一话漫画的所有图片,保存到一个目录里面去,按图片先后顺序用数字文件名保存.
一开始火车头,一直获取到图片链接都很好,但是下载不了,因为做了防盗链.
然后用uibot的使用浏览器下载文件的命令来下载,成功,因为有浏览器打开这个过程,破了防盗链.
现在问题是,怎么直接把打开网页之后,图片批量另存,或者是批量获取到这些图片的链接也可以,然后循环使用浏览器的下载文件命令就可以了.
在这里我碰到的问题是:
1,如果使用数据抓取功能,那只能抓取文字和链接,所以,选了图片的话,会提示数据元生成错误.
2,如果我使用的是获取当前网页源代码,然后再用运行js代码来分析所有图片地址,再下载的话.命令中填入的js代码过不了检查,应该是正规表达式跟软件的js代码容器有兼容问题,我不会处理.
js代码如下:
function getimgsrc(htmlstr) {
var reg = /<img.+?src=('|")?([^'"]+)('|")?(?:\s+|>)/gim;
var arr = [];
while (tem = reg.exec(htmlstr)) {
arr.push(tem[2]);
}
return arr;
}
提示:第二行,第29个字符' ' ?"无法识别的内容,这样.
恳请各位大佬指教.