语言检测神经网络

时间:2024-03-09 12:20:38
【文件属性】:

文件名称:语言检测神经网络

文件大小:9.38MB

文件格式:ZIP

更新时间:2024-03-09 12:20:38

Java

语言检测神经网络 在数据处理中,我使用了大小为510的向量。前255个索引用于存储1-ngram,其余索引用于存储3-gram。 我假设1克可以帮助识别字母(西里尔语,拉丁语等),而3克可以帮助识别同一字母内的语言。 激活函数SoftMax输出0到1之间的数字,这就是为什么矢量值在该范围内被标准化的原因。 层数的增加导致神经网络“学习”的时间增加。 而且,在最初的两次迭代中下降之后的错误率开始增加。 辍学率提高了准确性,但幅度不大(≈2-5%)。 我为自己得出的结论是,配置网络本身(尝试使用不同的激活功能,层数等)并没有多大帮助(也许只是个小数点),只有数据准备才是真正重要的。


【文件预览】:
Language-Detection-Neural-Network-master
----LanguageDetectionNN.iml(918B)
----data.csv(75.91MB)
----test.txt(463B)
----src()
--------main()
----target()
--------maven-status()
--------classes()
----LICENSE(1KB)
----saved.txt(4B)
----README.md(925B)
----test.csv(2KB)
----pom.xml(1KB)
----wili-2018-Small-11750-Edited.txt(6.41MB)
----.gitignore(286B)
----test.nn(1.23MB)
----out()
--------production()

网友评论