SRILM源代码分析笔记

时间:2015-09-25 05:17:16
【文件属性】:

文件名称:SRILM源代码分析笔记

文件大小:4.87MB

文件格式:RAR

更新时间:2015-09-25 05:17:16

SRILM 源代码 分析 ngram

SRILM源代码阅读笔记。 主要针对SRILM的ngram的训练,即ngram-count。 7个文件: 1.类图.jpg:与ngram-count相关的主要类的静态图(使用了starUML的逆向工程工具); 2.ngram-count.jpg:从语料训练出模型的主要流程; 3.lmstats.countfile.jpg:ngram-count的子流程,用于构建词汇表和统计ngram的频度; 4.ngram.estimate.jpg:ngram-count的子流程,在词汇表和ngram频度的基础上计算ngram条件概率 以及backoff权值的过程; 5.ngram.read.jpg:与训练无关,读取ARPA格式的语言模型的过程; 6.SRILM.uml:以上5个文件的原始图,以StarUML绘制(利用StarUML可直接编辑) 7.SRILM.vsd:ngram-count相关的主要数据结构的内存布局 + ngram条件概率计算公式的参数说明, 以visio绘制(利用visio可直接编辑)


【文件预览】:
SRILM_note
----SRILM.uml(3.59MB)
----SRILM.vsd(126KB)
----ngram-count.jpg(1.05MB)
----ngram.estimate.jpg(1.55MB)
----ngram.read.jpg(805KB)
----lmstats.countfile.jpg(929KB)
----readme.txt(4KB)
----类图.jpg(1.67MB)

网友评论

  • nice to share
  • 非常有帮助
  • 列的很详细
  • 好用不错的
  • 好资源。。。
  • 框图很适合学习,谢谢楼主分享
  • 很赞 图略大
  • 良心之作,谢谢作者,类图很详细。作用讲的也不错
  • 框图很适合学习,谢谢楼主分享
  • 图多,但是里面连接打不开了
  • 总结的好详细,程序架构总结的很清晰,对我好受用,感谢作者
  • 由图组成,结构比较清晰,可以参考来理解
  • 可以下来看看,稍微有点帮助,因人而异
  • 类图画的超nice,对理解代码结构很有帮助
  • 框图有帮助,谢谢
  • 对我很有用。
  • 很不错的资源,系统的提取了sri的主要内容
  • 类图很多,适合于学习架构,不适合只是拿来用的人
  • 很赞的类图,非常不错,多谢分享。
  • 要改sri的代码,看下底层arpa是怎么读取和保存的,概率和回归计算部分还没看 非常好,画程序流程图是非常费力的