SRILM源代码仔细分析

时间:2021-05-26 10:58:21
【文件属性】:

文件名称:SRILM源代码仔细分析

文件大小:10.75MB

文件格式:RAR

更新时间:2021-05-26 10:58:21

SRILM代码

SRILM源代码阅读笔记。 主要针对SRILM的ngram的训练,即ngram-count。 7个文件: 1.类图.jpg:与ngram-count相关的主要类的静态图(使用了starUML的逆向工程工具); 2.ngram-count.jpg:从语料训练出模型的主要流程; 3.lmstats.countfile.jpg:ngram-count的子流程,用于构建词汇表和统计ngram的频度; 4.ngram.estimate.jpg:ngram-count的子流程,在词汇表和ngram频度的基础上计算ngram条件概率 以及backoff权值的过程; 5.ngram.read.jpg:与训练无关,读取ARPA格式的语言模型的过程; 6.SRILM.uml:以上5个文件的原始图,以StarUML绘制(利用StarUML可直接编辑) 7.SRILM.vsd:ngram-count相关的主要数据结构的内存布局 + ngram条件概率计算公式的参数说明, 以visio绘制(利用visio可直接编辑)


【文件预览】:
SRILM_note
----SRILM.uml(3.59MB)
----lmstats.countfile.jpg(929KB)
----ngram.estimate.jpg(1.55MB)
----ngram-count.jpg(1.05MB)
----类图.jpg(1.67MB)
----ngram.read.jpg(805KB)
----readme.txt(4KB)
----SRILM.vsd(126KB)
SRILM_笔记
----1-110414220F2()
--------任务说明.txt(12KB)
--------all02s.map(298KB)
--------all09t.map(279KB)
--------all10s.map(569KB)
--------all03u.map(344KB)
--------all06u.map(338KB)
--------all05s.map(285KB)
--------all04u.map(340KB)
--------更多下载.......url(76B)
--------ra2.csf(269KB)
--------all11t.map(379KB)
--------all08u.map(427KB)
--------all12s.map(183KB)
--------all07t.map(309KB)
--------all01t.map(224KB)
----SRILM_note()
--------SRILM.uml(3.59MB)
--------lmstats.countfile.jpg(929KB)
--------ngram.estimate.jpg(1.55MB)
--------ngram-count.jpg(1.05MB)
--------类图.jpg(1.67MB)
--------ngram.read.jpg(805KB)
--------readme.txt(4KB)
--------SRILM.vsd(126KB)

网友评论