后羿采集器这是一个完全免费和易于使用的网络数据收集器。该软件由前谷歌技术团队独立开发。可以说,这是一个专门为小白设计的软件。该软件的所有功能都是一键操作。用户只需输入网站,该软件将一键收集网络数据。最新版本的后羿收集器支持多端登录,用户可以使用Windows、macOS以及Linux系统运行软件,方便用户将软件携带至各个设备上使用。后羿采集器软件还支持将网页数据导出到本地功能,而且还支持txt、excel等格式可以帮助用户更好地查看网页数据。
后羿采集器软件特色
智能识别数据,小白神器
自动识别:列表、表格、链接、图片、价格等
【可视化点击,简单上手】
支持多种数据导出方法
收集结果可以导出到当地支持TXT、EXCEL、CSV和HTML文件格式也可以直接发布到数据库(MySQL、MongoDB、SQL Server、PostgreSQL)供您使用。
【功能强大,提供企业级服务】
无论是收集稳定性还是收集效率,后羿满足个人、团队和企业的采集需求,无论是采集稳定性还是效率。
丰富的功能: 定期采集、自动导出、文件下载、加速引擎、按组启动和导出,Webhook,RESTful API,智能识别SKU和大图等。
【云账号,方便快捷】
全平台支持,无缝切换
同时支持Windows、Mac和Linux各平台版本的全操作系统采集软件完全相同,无缝切换。
后羿采集器软件功能
可视化自定义采集过程
问答指导、可视化操作、自定义采集过程
自动记录和模拟网页操作顺序
选择网页数据
点击鼠标,选择要爬的网页内容,操作简单
文本、链接、属性可以选择,html标签等
批量运行数据采集
根据采集过程和抽取规则,后羿采集器自动批量采集
可切换软件后台运行,不打扰前台工作
收集的数据导出和发布
采集的数据自动表格化,字段自由配置
支持数据导出Excel等本地文件
一键发布CMS网站/数据库/微信账号等媒体
后羿采集器软件安装步骤
双击打开安装包,点击“我接受”
点击选择安装位置“安装”,等待安装完成
后羿采集器软件使用方法
定制收集百度搜索结果数据的方法
1)启动后羿收集器,进入主界面,选择自定义收集,点击创建任务按钮创建 "定制收集任务"
手动输入:直接输入输入框URL,多个URL必须换行分割
点击从文件中读取:用户选择存储器URL文件中可以有多个文件URL地址,地址必须换行分割。
步骤2:自定义采集过程
1)点击创建后自动打开第一个URL然后进入自定义设置页面,默认创建了一个开始、打开和结束的过程块。底部模板区域用于拖动到画布中生成新的过程块;单击打开页面中的属性按钮修改打开的网站
2)添加输入文字流程块:在底部模板区中拖拽输入文字块到打开网页块后面附近,当出现阴影区域的时候可以松开鼠标,此时会自动连接,添加完成
点击输入框Xpath属性按钮,点击属性菜单中的图标,点击网页中的输入框,点击输入文本属性按钮,在菜单中输入要搜索的文本。
。
用于设置下一个列表页面的循环加载。在循环块内的循环条件块中设置详细条件,点击操作按钮,选择单个元素,然后点击属性菜单中的元素xpath属性按钮,同上点击网页中的下一页按钮。默认情况下,循环次数属性按钮为0,即不限制点击下一页的次数。
用于设置循环提取列表页面中的数据。在循环块内的循环条件块中设置详细条件,点击操作按钮,选择不固定元素列表,然后点击属性菜单中的元素xpath属性按钮,然后连续点击网页中的第一块和第二块元素两次。默认情况下,循环次数属性按钮为0,即列表中收集字段的数量不受限制。
点击下一页按钮执行,点击元素xpath属性按钮当前循环中元素的属性按钮xpath选项。
设置网页加载等待时间也是如此。
用于设置从列表页面中提取的字段规则,点击属性按钮中使用循环中的元素按钮,选择循环中的元素选项。单击元素模板属性按钮,单击字段表中的加减添加删除字段,单击选择操作添加字段,即单击添加号码后,鼠标移动到网页元素。
4)点击开始收集,启动收集
采集和导出数据
1)在收集任务运行中
2)采集完成后,选择“导出数据”数据可以导出到本地文件
4)采集数据导出后