中文自动分词&全文检索@统计工具(GBK版)2.11 v2.11
发布时间:2019-07-26
软件语言:简体中文
软件大小:3.65MB
软件授权:免费版
软件版本:v2.11
相关链接:软件官网
软件类型:国产软件
软件平台:Win9x/Me/NT/2000/XP/2003
软件类型: 教育教学  /  文科工具
关键字:中文自动分词全文检索@统计工具(GBK版)最新版,中文自动分词全文检索@统计工具(GBK版)官方下载,中文自动分词全文检索@统计工具(GBK版)2.11
软件评分:
本零星具备中文自动分词、全文检索、统计等根基功能,详细介绍如下:
一、中文自动分词
   1)能对于给定的中文文本妨碍自动分词、词性一级、词性二级标注;
   2)反对于大批量文本的自动分词及词性标注处置,可处置各级子文件夹下的文件;
   3)能凭证待分词及标注文本的种别,加挂用户自界说辞书,进一步后退分词以及标注的精确度;
   4)用户可对于零星辞书妨碍扩展,可削减、删除了、魔难零星辞书,可将零星辞书输入为TXT文本编纂后再转换为零星用的电子辞书;
   5)反对于人名、地名、机构名等未登录词识别;
   6)反对于基于GBK字符集的简、繁体文本的处置。
二、全文检索
   1)能对于给定的大批量文天职辩建树基于字、词、词及词性的三种索引库;
   2)掀开响应的索引库后,可妨碍字串、词串、词及词性串的全文检索;
   3)能展现检索服从的缘故,点击后可自动掀开对于应的文本,妨碍详细的查阅;
   4)反对于语言学属性的全文检索,可操作检索串中字串的先后搭配及规模;
   5)能操作检索服从中关键字串先后展现的字数并对于服从中的查问关键字串以红色或者蓝色展现。
三、统计
   1)可对于大批量文本妨碍字频、词频统计,可处置各级子文件夹下的文件;
   2)对于统计服从,提供基于字符码表、频率、拼音、部首四种方式的排序展现;
   3)能对于指定文件夹及子文件夹下的所有的TXT文本文件妨碍词频统计(对于未分词文本可边自动分词边统计或者对于已经分词并经家养校对于的文本妨碍词频统计);
   4)词频统计工具不是基于词表的词才统计,而是将分词服从中所有的词妨碍词频统计;
   5)可对于统计、检索服从妨碍编纂并保存为TXT或者RTF格式的文件。
最新更新
下载地址