大数据搜索与挖掘平台

NLPIR大数据搜索与挖掘共享平台介绍

基于完美双数组TRIE树的词频统计

柱形图展现方式

折线图展现方式

  本演示平台只展示了名词、动词、形容词三种开放词类的Top 10结果。这类结果已经足够支持后面的文本向量化计算,并达到较好的效果。基于我们的完美双数组TRIE树的专利算法(近期有进一步的优化),NLPIR的词频统计算法的效率较高,是常规算法的十倍以上。该算法的效率不会随着待统计结果数目的剧增而指数级增长,一般是呈亚线性增长。建议大家调用NLPIR/ICTCLAS开放的词频统计接口。

关于NLPIR
关于我们
微信扫一扫
NLPIR Big Data Search and Mining Platform Copyright | 2015(C) Big Data Search and Mining Lab | Beijing Institute of Technology All rights reserved.