文件名称:CKY_Algorithm_PCFG:概率上下文无关文法的 CKY 算法
文件大小:474KB
文件格式:ZIP
更新时间:2024-07-22 12:10:26
Python
作业网址: : #PART 1:如何运行代码 问题 4:Shell 脚本:q4.sh 运行大约需要 20 秒 给定从训练数据产生计数的代码 python count_cfg_freq.py parse_train.dat > cfg.counts --> 生成计数文件 用稀有替换单词并用稀有生成新的训练数据 python add_rare.py cfg.counts parse_train.dat > parse_train_rare.dat --> 将带有稀有的新源文件输出到 parse_train_rare.dat 生成稀有训练数据的计数 python count_cfg_freq.py parse_train_rare.dat > cfg_rare.counts --> 生成新的计数文件 问题 5:Shell 脚本:q5.sh 耗时不到 2 分钟 appllies cky_a
【文件预览】:
CKY_Algorithm_PCFG-master
----parse_train.dat(1.25MB)
----parse_train_vert.dat(1.39MB)
----q6.sh(990B)
----add_rare.py(1KB)
----count_cfg_freq.py(2KB)
----README.md(11KB)
----q5.sh(316B)
----cky_algorithm.py(4KB)
----parse_dev.dat(13KB)
----q4.sh(447B)
----cky_algorithm2.py(6KB)
----eval_parser.py(3KB)
----pretty_print_tree.py(1KB)
----parse_dev.key(60KB)