【文件属性】:
文件名称:ngrams:根据共享ngram的数量从词汇表中选择单词
文件大小:9KB
文件格式:ZIP
更新时间:2024-03-10 02:14:59
C++
该存储库实现计算n-gram并使用它们匹配单词。 函数计算给定两个单词的所有唯一n-gram(最多给定的最大n),并对两个提供的单词中存在多少个唯一n-gram进行计数。
应用程序文件位于文件夹“ src”中。 除了C ++标准库以外,该应用程序没有外部依赖项。 该应用程序由以下文件组成:ngrams.cpp ngrams.hpp main.cpp
使用以下语法在命令行上运行该应用程序。
program_name --vocabulary vocabulary.txt --words word_list.txt --output output.txt
使用普通ngram数除以两个单词的总ngram数,将word_list.txt的每一行与vocabulary.txt中的一行匹配。 输出将写入output.txt。
【文件预览】:
ngrams-master
----.gitignore(83B)
----src()
--------ngrams.hpp(930B)
--------ngrams.cpp(4KB)
--------test.py(1006B)
--------main.cpp(2KB)
----LICENSE(16KB)
----README.md(825B)