文件名称:lot:LOT暑期学校2018-低资源语言的语言技术
文件大小:21.15MB
文件格式:ZIP
更新时间:2024-05-31 10:03:39
课程说明 语言技术(LT)的最新研究很大一部分仅限于少数几种语言。 尽管创建,提供和使用了越来越多的数据集并将其用于英语和其他几种语言,但世界上绝大多数语言几乎从未成为LT研究的对象。 在本课程中,我们将介绍和讨论所谓的“低资源语言”的几种定义,并且我们将研究在数据形势严峻的情况下如何为此类语言开发LT系统(例如标记器或解析器)。 特别是,我们将讨论如何将语言注释或模型从资源丰富的语言转换为资源贫乏的语言。 在这种情况下,我们必须将两种语言在词源上密切相关的情况与不存在这种关系的情况区分开。 我们还将看到如何将这些方法应用于低资源语言的“特殊”类型,例如历史语言变体,方言和社会语言,它们的自动处理面临类似的挑战。 日常计划 周一 语言学和计算语言学中低资源语言的定义 主要语言技术应用及其资源要求概述 Yulia Tsvetkov(2017):使用低资源语言的机遇与挑战。 (幻灯片,第1部分
【文件预览】:
lot-master
----slides1.pdf(4.66MB)
----slides4.pdf(5.09MB)
----slides5.pdf(4.09MB)
----slides3.pdf(4.73MB)
----README.md(4KB)
----slides2.pdf(5.68MB)