词频统计工具是一款可能统计多种文档里辞汇泛起频率的软件。词频统计工具反对于Word文档(.doc;.docx)、网页文件(.htm;.html)或者文本文件(.txt)中所有中英文单词泛起的总次数,或者分说在各文件中泛起的频率。统计服从可能按泛起次数排序输入为Excel表格或者Word表格文档。
词频统计工具功能介绍:
全量统计方式,即统计给定多个文档中的所有辞汇的泛起词频;
指定统计方式,只统计指定的某些特殊辞汇的泛起词频。
可能抉择只统中文辞汇、英语辞汇或者标点标志。
词频统计工具罕有下场:
问:词频合乐成果是甚么样的?好比我想把一篇文档妨碍分词,统计出高频辞汇,这样能做到吗?分词是单个字,仍是一个词语?
答:把一篇文档妨碍分词,统计出高频辞汇,这便是这个软件的功能。分词是按语言学上的词语,好比“中化国夷易近共以及国”算一个词语。而且,对于一些新词,或者特殊界说的辞汇,如“新浪微博”这种新发生的辞汇,软件提供了“自界说辞汇表”功能,您惟独把它削减到自界说的辞汇表中,就能作为一个词来妨碍统计。
词频统计工具更新日志:
v2.85
新版本功能优化;
速率极猛后退。
新版优化了对于HTML文档妨碍统计的挨次。
美满了用户运用习气影像功能。