文件名称:corpus:乌克兰语的布朗语料库
文件大小:4.99MB
文件格式:ZIP
更新时间:2024-05-26 13:08:11
Python
乌克兰语的布朗语料库 任务 创建一个开放的,体裁均衡的,将来带有注释的现代乌克兰语(BRUK)语料库,使用量为100万个单词。 语料库建立在形成著名英语语料库Brown的基础上。 储存库结构 -辅助文件 -为身体收集的文本片段 以乌克兰文学语言编写的经过验证的片段 -检查包含错误的片段 -测试的片段不符合要求(例如口头演讲) -片段等待检查 文档:有关语言问题的片段和决策的要求 -辅助脚本:统计数据的计算和已添加作品的列表 团队 瓦西尔·斯塔科(Vasil Starko) 安德里·雷辛(Andriy Rysin) 奥尔加·加维拉(Olga Gavura) 纳塔利娅·切利特科(Natalia Cheylytko) 马里亚纳·罗曼尼辛(Mariana Romanyshyn) 阿纳斯塔西娅·奥西达奇(Anastasia Osidach) 凯瑟琳·阿洛什基娜(Catherine Al