文件名称:new words Discovery
文件大小:54KB
文件格式:7Z
更新时间:2017-09-04 09:48:02
C++ new words Discovery
所采用的新词发现的算法思想来源于知名博主matrix67的一篇文章《互联网时代的社会语言学:基于SNS的文本数据挖掘》,算法实现改编之《新词发现之爆笑NBA》提供的python代码。 我仅仅是将原来的python代码改写成C++代码。写的比较匆忙,没有做很好规划,不过使用是完全没问题。
【文件预览】:
NewWordsDiscovery
----GenerateWords.cpp(1KB)
----ToolParser.cpp(8KB)
----Solidation.h(969B)
----NewWords.vcproj(4KB)
----CandidateFreq.cpp(3KB)
----FreeDegree.cpp(7KB)
----FreeDegree.h(1KB)
----ToolParser.h(378B)
----NewWords.sln(881B)
----main.cpp(944B)
----Common.h(967B)
----GenerateWords.h(532B)
----Solidation.cpp(6KB)
----CandidateFreq.h(649B)
----测试数据()
--------input.txt(158KB)