Screaming Frog SEO Spider免费版是一种网络爬虫开发工具,专门用于抓取网站进行分析。它可以有效地爬上小型和超大型网站,允许用户实时分析结果,并通过程序直接收集关键的现场数据SEO能够做出明智的决定,这个软件完全支持使用这个XPath提取数据,所以只要用户的网站结构简洁,就不用担心在这里抓取时可能会出现一系列的错误和遗漏问题,其中检测企业的网站和搜索网络资源都非常方便。
Screaming Frog SEO Spider免费软件特点:
找到断开的链接
立即抓取网站,找到损坏的链接(404)和服务器错误。批量导出错误和源URL修理或发送给开发人员。
审计重定向
找到断开的链接和错误
在网站迁移中找到临时和永久的重定向,识别重定向链和循环,或上传网站列表进行审计。
发现搜索引擎漫游器在抓取你的网站时遇到的所有响应代码、损坏的链接和错误。
分析页面标题和元数据
审核重定向
分析页面标题和元描述,并确定页面标题和元描述在您的网站中过长、短、丢失或重复。
搜索机器人遇到的临时和永久重定向可能与浏览器或模拟爬网中的重定向不同。
找到重复的内容
使用XPath提取数据
识别大页和慢页
使用CSS Path,XPath或regex从网页的HTML收集任何数据。这可能包括社会元标签、额外标题、价格SKU或更多!
Screaming Frog SEO Spider免费软件功能:
查找断开的链接、错误和重定向
分析页面标题和元数据
审查元机器人和指令
使用“URL列出日志文件数据导入和匹配任何数据。因此,导入爬网、指令或外部链接数据进行高级分析。
审计hreflang属性
找到重复的页面
生成 站点地图
爬网限制
抓取配置
保存抓取并重新上传
3、找到断开的链接和错误
搜索自定义源代码
发现搜索引擎漫游器在抓取你的网站时遇到的所有响应代码、损坏的链接和错误。
Google Analytics集成
5、提高预算
Screaming Frog SEO Spider免费版软件亮点:
批量导出错误和来源URL以修复或发送给开发人员
导入网站列表并匹配日志文件数据进行识别Googlebot孤立或未知的网页或网站尚未被捕获。
发现精确的重复网址、部分重复的网页标题、说明或标题等元素
使用CSS Path,XPath或regex从网页的HTML收集任何数据
分析页面标题和元数据,审查元机器人和指令
Screaming Frog SEO Spider免费版软件用法:
一、爬行抓取
常规抓取
抓取子文件夹
抓取网站列表
二、组态
为了将来能够加载,请单击保存配置文件“文件>另存为”并调整文件名(最好是描述性的)
无痕(小号)窗口还可以让你用多个账号登录网络游戏、网络社区和论坛。每个无痕(小号)窗口下登录的网站账号都是独立的,不会串号。多玩游戏,多参观论坛更方便。
重置为原始Screaming Frog SEO Spider 13免费版默认配置,请选择“文件>配置>清除默认配置”
这两个浏览器都支持第三方扩展支持,360安全浏览器在安装过程中会安装几个常用的浏览器插件,Screaming Frog SEO Spider(网络爬虫开发工具)第三方插件加第三方插件。如需使用第三方插件,可随时安装到扩展中心。
三、出口
数据导出的主要方法有三种:
导出顶窗数据:只需点击左上角“导出”按钮可以从顶窗选项卡导出数据
导出较低的窗口数据(URL信息、链接、输出链接、图像信息):要导出这些数据,只需在顶部窗口中右键单击要导出数据的URL,然后单击“导出”下的“URL信息”、“链接”、“出链接”或“图片信息”
批量导出:位于顶层菜单下,允许批量导出数据。您可以通过“all in s”选项导出捕获中发现的链接的所有实例,也可以将所有链接导出到具有特定状态代码(如2XX,3XX,4XX或5XX响应)的URL。例如,选择“链接中的客户端错误4XX”选项将导出所有链接到所有错误页面(如404错误页面)。您还可以导出所有图像替换文本,所有图像缺乏替代文本和所有锚点文本