懒人采集器官方版是一款极其实用的网页信息采集工具,具备内置浏览器和可视化操作功能,无需专业网络知识,用户轻松点击鼠标即可创建采集任务。可自定义采集所需网页内容,并智能识别网页列表、采集字段和分页等。提供可视化采集器功能,支持自由组合功能模块,实现自动登录、发布、验证码识别等,甚至生成独立应用程序。用户可将采集的数据内容单独保存,方便以后使用。
1、操作简单,可通过鼠标点击的方式轻松选取要抓取的内容
2、支持三种高速引擎:浏览器引擎、HTTP引擎、JSON引擎,内置优化后的火狐浏览器,加上独创的内存优化使浏览器采集也可以高速运行,甚至可以快速转换为HTTP方式运行,享受更高的采集速度,而在抓取JSON数据时,同样可以使用浏览器可视化方式,通过鼠标点选需要抓取的内容,完全不需要去分析JSON数据结构,使非网页专业设计人士也可以轻松抓取需要的数据
3、不用分析网页请求和源代码,却支持更多的网页采集
4、先进的智能算法,可以一键生成目标元素XPATH、自动识别网页列表、自动识别分页中的下一页按钮
5、支持丰富的数据导出方式,可以导出为txt文件、html文件、csv文件、excel文件,也可以导出到已有的数据库,如sqlite数据库、access数据库、sqlserver数据库、mysql数据库,通过向导的方式简单映射字段,即可轻松导出到目标网站数据库中
1、可视化向导:所有采集元素,自动生成采集数据
2、计划任务:灵活定义运行时间,全自动运行
3、多引擎支持:支持多个采集引擎,内置高速浏览器内核、HTTP引擎和JSON引擎
4、智能识别:可自动识别网页列表、采集字段和分页等
5、拦截请求:自定义拦截域名,方便过滤站外广告,提高采集速度
6、多种数据导出:可导出为Txt 、Excel、MySQL、SQLServer、 SQlite、Access、网站等
系统组件:
① .NET Framework 4.7.2
② VC++2015运行库
以上两个组件缺一不可,请务必安装完整,否则将无法正常运行。