爬山虎采集器免费版是一款高效的网页信息采集软件,支持99%的网站数据采集,拥有优秀的只能分析的系统,给用户带来可视化界面,让您轻松实用,点击自动生成采集脚本Excel表格,api数据库文件和其他内容,帮助您管理网站数据信息,如果您需要收集指定的网页数据,使用软件,软件还提供网页浏览功能,可以直接输入网站收集数据,输入收集地址可以设置软件收集方案,收集数据直接显示在软件中,可以导出数据到本地使用。
软件特色
爬山虎采集器计算机版的主要功能:
向导模式
快速高效
简单易用,轻松点击鼠标自动生成脚本
内置高速浏览器内核HTTP引擎模式可以快速收集数据
99%的互联网网站可以收集,包括单页应用Ajax等
原创高速内核
功能介绍
自研浏览器内核速度快,远超对手
智能识别
定期操作脚本
可按计划定期操作,无需人工操作
导出多种数据
支持Txt 、Excel、MySQL、SQLServer、SQlite、Access、网站等
爬山虎采集器计算机版软件特点:
通用灵活
99%网站可以收集,静态网页,动态页面,单页应用,手机APP都可以抓,GET、POST都可以采集
高速采集
内置高效浏览器引擎,HTTP引擎、JSON发动机,经过极致优化的核心,多线程采集,快速飞行。
增量更新
使用方法
采集任务可以通过定期运行和增量更新完全自动化,实时监控目标网站,实现同步更新。
第一步:输入采集网站:
下载批量文件
打开软件,新任务,输入需要收集的网站地址。
可自动下载图片,PDF、DOCX支持自定义保存目录和自定义文件名称。
第二步:智能分析,全程自动提取数据
爬山虎采集器电脑版使用方法:
输入采集网站
在进入第二步后,智能分析到第二步后,爬山虎采集器全自动智能分析网页,并从中提取列表数据。
将收集到的数据导出到表格、数据库、网站等操作任务中Csv、Excel以及支持各种数据库的数据库api导出。
问:如何过滤列表中的前面N个数据?
爬山虎采集器电脑版更新日志:
修复分页采集优先级
单击列表模式菜单中的列表xpath
提前检验xpath和正则的正确性
问:如何抓包获取Cookie,手动设置?
其他使用了Inputbox的验证修改
首先,使用谷歌浏览器打开要收集的网站并登录。
增加数据处理-前后缀
修复英语系统下的乱码问题
修复form的解析
任务列表按时间顺序排列
完善检测列表数据(列表)a元素)
模拟操作添加鼠标和键盘