赶集网信息收集器基于开源的 PDI 平台。
PDI( 也称为Kettle ) 是一款开源的数据抽取、转换、加载 (ETL) 工具,反对于种种罕有数据源,如种种数据库,平面文件,XML文件、Excel 文件、Access文件等。
用户可能利便的以拖拽的方式,妄想数据的流程,界说数据格式的转换。
除了数据转换外,Kettle 还以作业的方式反对于良多罕用操作,如发送、接管邮件、FTP 上传、下载、文件规画等。
将作业以及流程配合运用,用户可能轻松的实现大部份的数据处置使命。
纵然不是开拓职员经由 Kettle 也能做一些重大的数据处置使命,如:
从 Excel 文件抉择销售金额大于1000 元的商品放到 Access 文件中,相似这样的功能,不用写一行代码,直接经由图形界面配置装备部署就能了。
对于开拓职员来说更是一个强盛的刀兵,经由自己功能以及插件的扩展功能,可能做你想做的任何数据处置方面的使命。
赶集网信息收集器是 PDI 平台的一个插件,可能收集到赶集网信息的问题、电话号码、宣告光阴、URL、及用户自界说的收集项。