文件名称:从语料库中学习-自然语言处理概论
文件大小:1.58MB
文件格式:PPT
更新时间:2024-05-14 08:01:02
自然语言 概论
从语料库中学习 • 语料库(Corpus, Corpora) – 按照一定的原则组织在一起的真实的自然语言数据(包括书面语和口语)的集合,主要用于研究自然语言的规律,特别是统计语言学模型的训练以及相关系统的评价和测试。 • 可以是原始的文本(生语料库) • 也可以是带标记的文本(熟语料库) • 语料库是统计NLP的知识来源
文件名称:从语料库中学习-自然语言处理概论
文件大小:1.58MB
文件格式:PPT
更新时间:2024-05-14 08:01:02
自然语言 概论
从语料库中学习 • 语料库(Corpus, Corpora) – 按照一定的原则组织在一起的真实的自然语言数据(包括书面语和口语)的集合,主要用于研究自然语言的规律,特别是统计语言学模型的训练以及相关系统的评价和测试。 • 可以是原始的文本(生语料库) • 也可以是带标记的文本(熟语料库) • 语料库是统计NLP的知识来源