文件名称:langID-NLP:项目
文件大小:59.91MB
文件格式:ZIP
更新时间:2024-05-04 10:59:10
JupyterNotebook
langID-NLP 项目:语言识别 该项目涉及自然语言处理(“ NLP”)系统,该系统能够识别给定文本的语言。 它是M. Sc。的“高级自然语言处理”讲座中考试的一部分。 波茨坦大学的认知系统。 我们的团队由Bhuvanesh Verma,Ian Clotworthy和Arthur Hilbert组成。 该存储库包含WiLI-2018数据集:Thoma,Martin。 (2018)。 WiLI-2018-*语言标识数据库(版本1.0.0)[数据集]。 Zenodo。 要将笔记本用于语言识别,请执行以下操作: 导航到langID_NLP.ipynb 点击文件预览顶部的“在Colab中打开”横幅 在Colab菜单中,导航至“编辑”->“笔记本设置”,然后选择“硬件加速器:GPU” 运行笔记本
【文件预览】:
langID-NLP-master
----README.md(880B)
----langID_NLP.ipynb(939KB)
----WiLI-2018_data()
--------y_train.txt(469KB)
--------labels.csv(12KB)
--------x_train.txt(61.12MB)
--------README.txt(954B)
--------x_test.txt(62.15MB)
--------y_test.txt(469KB)