后羿采集器绿色版 v绿色版
发布时间:2019-08-04
软件语言:简体中文
软件大小:13.14MBMB
软件授权:免费版
软件版本:v绿色版
相关链接:软件官网
软件类型:国产软件
软件平台:WinAll
软件类型: 网络工具  /  制作辅助
关键字:后羿采集器最新版,后羿采集器官方下载,后羿采集器绿色版
软件评分:
后羿收集器是是原Google技术团队倾力打造的一款网页数据收集软件,可视化点选,一键收集网页数据,全平台,Win/Mac/Linux均可用,收集以及导出全收费,有限度耽忧用,可布景运行,速率实时展现。

后羿收集器

软件特色

  一、可视化自界说收集流程
全程问答式向导、可视化操作、自界说收集流程
自动记实以及模拟网页操作挨次
低级配置知足更多收集需要
二、点选抽取网页数据
鼠标点击选摘要爬取的网页内容、操作重大
可抉择抽取文本、链接、属性、html标签等
三、运行批量收集数据
软件凭证收集流程以及抽取纪律自动批量收集
快捷晃动,实时展现收集速率以及历程
可切换软件布景运行,不打扰前台使命
四、导出以及宣告收集的数据
收集的数据自动表格化,逍遥配置装备部署字段
反对于数据导出到Excel等沿海文件
以及一键宣告到CMS网站/数据库/微信公共号等媒体

运用措施

  自界说收集baidu搜查服从数据的措施
步骤1:建树收集使命
1)启动后羿收集器,进入主界面,抉择自界说收集并点击建树使命按钮建树 "自界说收集使命"

后羿收集器

  2)输入baidu搜查的URL,搜罗三种方式
一、手动输入:在输入框中间接输入URL,多个URL时需要换行分割
二、点击从文件中读取方式:用户抉择一个寄存URL的文件,文件中可能有多个URL地址,地址需要换行分割。
三、批量削减方式:经由削减并调解地址参数天生多个有纪律的地址

后羿收集器

  步骤2:自界说收集流程
1)点击建树后自动掀开第一个URL进而进入自界说配置页面,默认已经建树了开始、掀开网页、停止的流程块。底部模板区用于拖拽到画布中天生新的流程块;点击掀开网页中的属性按钮,可更正掀开的网址

后羿收集器

  2)削减输入翰墨流程块:在底部模板区中拖拽输入翰墨块到掀开网页块前面临近,当泛起阴影地域的时候可能松开鼠标,此时会自动衔接,削减实现

后羿收集器

  3)天生残缺流程图:模拟下面削减输入翰墨流程块的拖拽流程削减新块:如下图所示:

后羿收集器

  关键步骤块配置介绍
步骤2:定时期待用于期待前面掀开网页实现
步骤3:点击输入框Xpath属性按钮,在属性菜单中点击图标妨碍点选网页中的输入框,点击输入文本属性按钮,在菜单中输入要搜查的文本。
步骤4:用于配置点击开始搜查按钮,点击元素的xpath属性按钮,在菜单中点击点选图标,而后点击网页中的baidu一下按钮即可。
步骤5:用于配置循环加载下一列表页。在循环块外部的循环条件块中配置详细条件,此处点击操作按钮,抉择单个元素,而后在属性菜单中点击元素的xpath属性按钮,同上妨碍点选网页中的下一页按钮。循环次数属性按钮可默以为0,即不限度点击下一页的次数。
步骤6:用于配置循环抽取列表页中的数据。在循环块外部的循环条件块中配置详细条件,此处点击操作按钮,抉择不牢靠元素列表,而后在属性菜单中点击元素的xpath属性按钮,而后在网页中不断点选两次抽取第一块以及第二块元素。循环次数属性按钮可默以为0,即不限度列表中收取字段的数目。
步骤7:用于实施点击下一页按钮操作,点击元素xpath属性按钮,抉择运用之后循环中元素的xpath选项。
步骤8:同理用于配置网页加载期待光阴。
步骤9:用于配置在列表页抽取的字段纪律,点击属性按钮中运用循环中的元素按钮,抉择运用循环中的元素选项。点击元素模板属性按钮在字段表格中点击加减妨碍削减删除了字段,削减字段运用点选操作,即点击加号后鼠标挪移到网页元素上点击抉择。
4)点击开始收集,启动收集

后羿收集器

  步骤3:数据收集及导出
1)收集使运气转中

后羿收集器

  2)收集实现后,抉择“导出数据”可能把数据都导出到当地文件

后羿收集器

  3)抉择“导出方式”,将收集好的数据导出,这里可能抉择excel作为导出为格式

后羿收集器

  4)收集数据导出后如下图

后羿收集器

  后羿收集器是是原Google技术团队倾力打造的一款网页数据收集软件,可视化点选,一键收集网页数据,全平台,Win/Mac/Linux均可用,收集以及导出全收费,有限度耽忧用,可布景运行,速率实时展现。

软件截图
最新更新
下载地址