文件名称:transliteration_mining:以无监督,半监督和监督的方式提取翻译对的模型
文件大小:1.34MB
文件格式:ZIP
更新时间:2024-05-21 02:08:49
Java
音译挖掘 以无监督,半监督和监督的方式提取翻译对的模型 无监督挖掘-给定单词对列表 java -Dfile.encoding=UTF-8 -jar miner2.jar -unsupervised -train tmp/out.words 模型选项 注意:有时单词列表包含很多杂音。 您可以在单词列表中使用以下简洁脚本,然后再将其交给无人监督的矿工。 https://github.com/moses-smt/mosesdecoder/blob/master/scripts/Transliteration/clean.pl
【文件预览】:
transliteration_mining-master
----src()
--------MultigramGraphSemi_Unigram_Unsmooth_alpha.java(39KB)
--------MultigramGraphSupervised_UnigramFully.java(66KB)
--------MultigramGraphUn_traintestTrigram.java(67KB)
--------MultigramGraphSemi_Bigram_Unsmooth.java(58KB)
--------input.java(464B)
--------test_Bigram_unsmooth.java(36KB)
--------semiTest.java(32KB)
--------MultigramGraphSemi_Unigram_Unsmooth.java(41KB)
--------test_Bigram_smooth.java(41KB)
--------MultigramGraphSupervised_Bigram.java(54KB)
--------semiTest_Bigram1_supervised.java(40KB)
--------semiTest_Trigram_smooth.java(47KB)
--------MultigramGraphSemi_traintest_Bigram.java(59KB)
--------semiTest_Bigram1.java(40KB)
--------MultigramGraphSupervised_Trigram.java(67KB)
--------decode.java(9KB)
--------test_Trigram_smooth.java(47KB)
--------MultigramGraphUn_traintestBigram.java(39KB)
--------MultigramGraphSupervised_TrigramFully.java(70KB)
--------Mnode.java(2KB)
--------MultigramGraphSemi_Trigram.java(67KB)
--------semiTest_supervised.java~(34KB)
--------semiTest_supervised.java(34KB)
--------semiTest_Bigram1_smooth.java(42KB)
--------MultigramGraphUn_traintest.java(28KB)
--------semiTest_alpha.java(30KB)
--------Output.java(358B)
--------Main.java(26KB)
--------MultigramGraphUn_traintestBigram_smooth.java(40KB)
--------MultigramGraphSupervised.java(39KB)
--------MultigramGraphSemi_Trigram_Unsmooth.java(69KB)
--------Medge.java(1KB)
--------test_Trigram_unsmooth.java(42KB)
--------NoiseModel.java(31KB)
--------semiTestEditDist.java(32KB)
--------semiTest_smooth.java(34KB)
--------semiTest_Trigram_supervised.java(47KB)
--------semiTest_Trigram.java(44KB)
--------MultigramGraphSupervised_BigramFully.java(57KB)
--------MultigramGraphUn_traintestTrigram_smooth.java(49KB)
--------MultigramGraphSemi_traintest.java(42KB)
--------MultigramGraphUn_traintest_smooth.java(29KB)
--------pair.java(255B)
--------MultigramGraph.java(26KB)
----miner.jar(471KB)
----README.md(612B)
----miner2.jar(587KB)