本软件实现对于政府网、行业网以及企业网所有或者部份(可界说)网页的自动搜查,也可用于互联网。
本搜查引擎搜查已经在某直辖市某行业内网中个别运用,收集页面数十万页,运行在艰深PC机上,收集功能每一小时约一万条,搜查功能在秒级。
本搜查引擎可能设定从一个概况多个URL动身妨碍群集,在一次群集运行中对于一再网页不会一再群集;
可能设定每一个起始URL的群集层数;
可能设定群集网站的品级,并作为搜查排序的权值之一;
运用关键词妨碍搜查,按关键词适宜水平、光阴以及网站的紧张性权值妨碍排序,特意适宜政府、企业等内网的特色;
反对于周全群集以及更新群集,具备断点记实及不断群集能耐;
群集的同时建树索引,群集功能高;
软件可能自动运行,不需家养干涉;
功能robots.txt协议,反对于HTTP 1.1 gzip 缩短;
反对于多种平台。