Document_Language_Detection

时间:2024-07-17 23:32:48
【文件属性】:

文件名称:Document_Language_Detection

文件大小:4.41MB

文件格式:ZIP

更新时间:2024-07-17 23:32:48

Java

文档_语言_检测 为了测试语言检测器,您将在以下目录中找到类 Document_Language_Detection\out\production\Document_Language_Detection 您将找到两个类 trainer Class 和 Identifier Class。 培训师班 首先,您应该调用 Trainer 类来训练您的数据集并创建 .dat 文件。 该命令应按如下方式调用:第一个参数是经过训练的语言名称,然后是训练文件,例如我将在此处使用三个文本文件对其进行训练。 Java Trainer "Portugues" "PortuguesTrainingFile1.txt" "PortuguesTrainingFile2.txt" "PortuguesTrainingFile3.txt" 前面的命令将创建被视为葡萄牙语数据集的“Portugues.dat”数据文件。


【文件预览】:
Document_Language_Detection-master
----src()
--------DeutschTrainingFile3.txt(316KB)
--------DeutschTrainingFile2.txt(44KB)
--------FrenchTrainingFile2.txt(885KB)
--------PortuguesTrainingFile2.txt(102KB)
--------PortuguesTrainingFile3.txt(319KB)
--------EnglishTrainingFile3.txt(1.24MB)
--------ItalianTrainingFile3.txt(217KB)
--------Trainer.java(4KB)
--------PortuguesTrainingFile1.txt(280KB)
--------EnglishTrainingFile1.txt(206KB)
--------DeutschTrainingFile1.txt(64KB)
--------FrenchTrainingFile3.txt(739KB)
--------FrenchTrainingFile1.txt(50KB)
--------ItalianTrainingFile1.txt(142KB)
--------ItalianTrainingFile2.txt(292KB)
--------Identifier.java(7KB)
--------EnglishTrainingFile2.txt(626KB)
----Document_Language_Detection.iml(425B)
----README.md(2KB)
----out()
--------production()
----.idea()
--------misc.xml(465B)
--------encodings.xml(166B)
--------libraries()
--------workspace.xml(42KB)
--------vcs.xml(166B)
--------uiDesigner.xml(9KB)
--------copyright()
--------scopes()
--------compiler.xml(711B)
--------.name(27B)
--------modules.xml(296B)
----.gitignore.idea(590B)
----.gitattributes(378B)

网友评论