nlpir大数据语义智能分析系统 v6.0 官方版 v6.0
发布时间:2019-10-10
软件语言:简体中文
软件大小:150.96MB
软件授权:免费版
软件版本:v6.0
相关链接:软件官网
软件类型:国产软件
软件平台:Win10,Win8,Win7,WinXP
软件类型: 应用工具  /  应用其他
关键字:nlpir大数据语义智能分析系统,大数据语义智能分析系统,nlpir汉语分词系统
软件评分:

nlpir大数据语义智能合成零星是款业余的合成工具。nlpir大数据语义智能合成零星针对于大数据内容处置的需要,融会了收集精准收集、做作语言清晰、文本开掘以及收集搜查的技术,提供了客户端工具、云效率、二次开拓接口。

nlpir大数据语义智能合成零星特援用见:

 

一、精准收集

对于境内外互联网海量信息实时精准收集,有主题收集(凭证信息需要的主题收集)与站点收集两种方式(给定网址列表的站内定点收集功能)。

二、文档抽取

对于doc、excel、pdf与ppt等多种主流文档格式,妨碍文本信息抽取,信息抽取精确,功能抵达大数据处置的要求。

三、新词发现

从文本中开掘出新词、新意见,用户可能用于业余辞书的编撰,还可能进一步编纂标注,导入分词辞书中,后退分词零星的精确度,并顺应新的语言变更。

四、批量分词

对于原始语料妨碍分词,自动识他人名地名机构名等未登录词,新词标注以及词性标注。并可在合成历程中,导入用户界说的辞书。

五、语言统计

针对于切分标注服从,零星可能自动地妨碍一元词频统计、二元词语转移多少率统计。针对于罕用的术语,会自动给出响应的英文批注。

六、文本聚类

可能从大规模数据中自动合成出热门使命,并提供使命话题的关键特色形貌。同时适用于长文本以及短信、微博等随笔本的热门合成。

七、文天职类

凭证纪律或者磨炼的措施对于大批文本妨碍分类,可用于往事分类、简历分类、邮件分类、办公文档分类、地域分类等诸多方面。

八、摘要实体

对于单篇或者多篇文章,自动提炼出内容摘要,抽取人名、地名、机构名、光阴及主题关键词;便操作户快捷浏览文本内容。

九、智能过滤

对于文本内容的语义智能过滤魔难,内置国内最全词库,智能识别多种变种:形变、音变、繁简等多种变形,语义精准排比方。

十、激情合成

针对于当时指定的合成工具,零星自动合成海量文档的激情倾向:激情极性及激情值丈量,并在原文中给出正负面的患上分以及句子样例。

十一、文档去重

快捷精确地分说文件会集或者数据库中是否存在相同或者相似内容的记实,同时找出所有的一再记实。

十二、全文检索

反对于文本、数字、日期、字符串等种种数据规范,多字段的高效搜查,反对于AND/OR/NOT以及NEAR临近等查问语法,反对于维语、藏语、蒙语、阿拉伯、韩语等多种少数夷易近族语言的检索。

1三、编码转换

自动识别内容的编码,并把编码不同转换为其余编码。

软件截图
下载地址