文章采集是站长常常会遇到的事,很多人使用火车头采集器软件,采集正文中有多个图片的时候如果设置错误,会遇到只下载一张图片、采集后的正文多张图片同一个文件名的情况。

采集下载正文中多个图片方法如下:

1.保存文件名yyyyMMddHHmmss中表示以年月日时分秒为图片的文件名,火车头采集器软件会在正文中一次性正则匹配到所有图片,同时建立下载进程,这个时候以秒为单位就会让所有的图片是同一个文件名,在后面加一个“自增ID“来区别不同图片

2.“文件保存格式”处选择“随机文件名”

3.当然最好是用图片内容base64来命名,这样能避免多次下载相同图片,可惜火车头采集器软件中没有这样的设置