inltk:用于印度语的自然语言工具包旨在为应用程序开发人员可能需要的各种NLP任务提供现成的支持

时间:2024-02-24 09:09:27
【文件属性】:

文件名称:inltk:用于印度语的自然语言工具包旨在为应用程序开发人员可能需要的各种NLP任务提供现成的支持

文件大小:695KB

文件格式:ZIP

更新时间:2024-02-24 09:09:27

nlp deep-learning word-embeddings pytorch data-augmentation

用于印度语的自然语言工具包(iNLTK) iNLTK旨在为应用程序开发人员可能需要印度语提供的各种NLP任务提供开箱即用的支持。 iNLTK库的论文已在EMNLP-2020的NLP-OSS研讨会上被接受。 这的 文献资料 在签出详细文档以及安装说明 支持的语言 母语 语言 码 印地语 你好 旁遮普语 PA 古吉拉特语 gu 卡纳达语 n 马拉雅拉姆语 毫升 奥里亚 要么 马拉地语 先生 孟加拉 n 泰米尔语 ta 乌尔都语 ur 尼泊尔文 NE 梵文 SA 英语 恩 泰卢固语 te 代码混合语言 语言 脚本 码 简体中文(印地文+英文) 拉丁 高 Tanglish(泰米尔文+英文) 拉丁 塔恩 芒格利什语(马拉雅拉姆语+英语) 拉丁 毫升 包含iNLTK中使用的模型的存储库 语言 资料库 用于语言建模的数据集 ULMFiT LM的困惑(在验证集上) TransformerXL LM的困惑(在验证集上) 用于分类的数据集 分类: 测试仪精度 分类: 测试装置MCC 分类:笔记本再现性 ULMFiT嵌入可视化 TransformerXL嵌入可视化 印地语 3


【文件预览】:
inltk-master
----inltk()
--------tokenizer.py(5KB)
--------config.py(5KB)
--------inltk.py(7KB)
--------utils.py(803B)
--------const.py(56B)
--------__init__.py(14B)
--------download_assets.py(2KB)
--------static()
----LICENSE(1KB)
----setup.py(1KB)
----README.md(38KB)
----docs()
--------make.bat(795B)
--------conf.py(3KB)
--------requirements.txt(22B)
--------api_docs.md(42KB)
--------index.rst(469B)
--------Makefile(634B)
----.gitignore(150B)

网友评论