文件名称:deepcut:使用深度神经网络的泰语单词标记化库
文件大小:3.37MB
文件格式:ZIP
更新时间:2024-02-27 02:37:13
python deep-neural-networks deep-learning tensorflow keras
深切 使用深度神经网络的泰语单词标记化库。 什么是新的 v0.7.0从keras迁移到TensorFlow 2.0 v0.6.0允许排除停用词和自定义词典,通过半监督学习更新权重 v0.5.2更好的预训练权重矩阵 v0.5.1通过代码重构实现更快的标记化 examples文件夹提供了泰语文本分类问题的入门脚本 DeepcutJS ,您可以在尝试在网络浏览器上标记泰语文本 性能 卷积神经网络由NECTEC的BEST语料库(包括文章,新闻,小说和百科全书4个部分)的90%进行训练,其余10%进行测试。 它是一个二元分类模型,试图预测字符是否是单词的开头。 仅从“ true”类计算得出的结果如下
【文件预览】:
deepcut-master
----MANIFEST.in(108B)
----notebooks()
--------training.ipynb(5KB)
--------README.md(110B)
----Dockerfile(190B)
----custom_dict.txt(50B)
----requirements.txt(49B)
----examples()
--------true_intent_classification.py(4KB)
--------README.md(2KB)
----LICENSE(1KB)
----setup.cfg(40B)
----setup.py(774B)
----README.md(6KB)
----docs()
--------index.html(3KB)
--------model_lite.h5(1.18MB)
--------js()
--------README.md(908B)
--------css()
--------model_lite.bin(391KB)
----.gitignore(1KB)
----deepcut()
--------stop_words.py(2KB)
--------train.py(8KB)
--------utils.py(4KB)
--------model.py(2KB)
--------__init__.py(181B)
--------weight()
--------deepcut.py(12KB)