火车收集器 (LocoySpider)是一款业余的功能强盛的收集数据/信息开掘软件,经由锐敏的配置装备部署,您可能很轻松的从网页上抓取翰墨、图片、文件等任何资源。挨次反对于短途下载图片文件,反对于网站上岸后的信息收集,反对于探测文件着实地址,反对于署理,反对于防盗链的收集,反对于收集数据直接入库以及模拟人手工宣告等良多功能特色。火车收集器反对于从任何规范的网站收集取患上您所需要的信息,如种种往事类网站、论坛、电子商务网站、求职应聘网站等。同时具备强盛的网站登录收集、多页以及分页的收集、网站跨层收集、POST收集、剧本页面收集、动态页面收集等低级收集功能。强盛的php以及c#插件反对于,让您可能经由二次开拓实现您所想要的任何更强盛的功能。
火车收集器特有功能:一、反对于所有网站编码:欠缺反对于收集所有编码格式的网页,挨次还可能自动识别网页编码。二、多种宣告方式:反对于当初所有主流以及非主流的CMS,BBS等网站挨次,经由零星的宣告模块能实现收集器以及网站挨次间的欠缺散漫。三、全自动:无人值守使命,配置装备部署好挨次后,挨次将凭证您的配置自动运行,残缺无需家养干涉。四、当地编纂:当地可视化编纂已经收集的数据。五、收集测试:这是此外任何同类收集软件所不能比的,挨次反对于直接魔难收集服从并测试宣告。六、规画利便:运用站点+使命方式规画收集节点,使命反对于批量操作,再多的数据规画也很轻松。
V8版本削减的功能
1.削减宣告扩展功能,开拓了良多CMS的宣告扩展
2.削减取患上更起初程收集纪律功能,用户可能自建纪律效率器,向自己客户提供收集纪律
3.削减更多运用扩展,如E商统计,极速搜查,论坛收集器,微博数据助手等
4.二级署理削减页面缓存功能,利便短期内对于统一网页妨碍收集。
5.起始网址削减自界说语法,可能天生更多重大网址
6.将google,bing,有道翻译集成到汉译英翻译模块中
7.当地库转换时削减了保存数据选项
8.POST收集网址部份削减了文本导入搜查词功能
9.削减网盘上传功能,一个文本能够同时上传多个网盘
10.削减将EXCEL数据导入收集器功能
11.POST取患上网址部份削减了一个更正header功能
12.反对于下载ftp中的文件
13.标签处置中加了一个运行C#代码功能
14.使命搜查功能中削减分组搜查
15.更正测试宣告,削减入库以及运用扩展测试宣告
16.入库以及web宣告削减了个复制配置装备部署右键菜单
17.零星托盘削减展现之后挨次运行目录功能
18.当地交流削减可选操作全部数据库的选项
19.火车收集器使命右键菜单削减shift键功能
运用规模垂直搜查(或者称为业余搜查)效率 信息集聚以及门户效率 企业网信息集聚 商业情报收集 论坛或者博客迁移 智能信息署理 总体信息检索 信息开掘
适用群体一、公司总体二、政府机关与队伍三、门户网站四、往事媒体五、广告与市场钻研机构六、金融机构七、电信挪移联通八、迷信与技术钻研单元九、网站站长十、电子商务(如淘宝店长等)十一、其余 2010-04-25自动降级更新已经处置如下下场——————1.修复了收集内容或者网址时侵蚀导致挨次退出的下场.2.下载文件并下载时文件地址过错导致挨次退出的下场.3.运用插件时测试宣告运用的数据不是插件处置后的数据的bug.4.更正了一个智能提取时SY标签提取过错的下场.5.列表页标签部份情景下揭示一再的bug.6.在分词或者摘要时不存在某个标签时可能侵蚀的bug.7.在收集时提供了更多的细节展现.更便操作户魔难进度.8.探测文件并下载给加了不分说巨细写功能.9.修复倒序宣告时部份秩序不同过错的下场.