【文件属性】:
文件名称:从语料库中学习-自然语言处理概论
文件大小:1.58MB
文件格式:PPT
更新时间:2021-04-24 14:14:22
自然语言 概论
从语料库中学习
• 语料库(Corpus, Corpora)
– 按照一定的原则组织在一起的真实的自然语言数据(包括书面语和口语)的集合,主要用于研究自然语言的规律,特别是统计语言学模型的训练以及相关系统的评价和测试。
• 可以是原始的文本(生语料库)
• 也可以是带标记的文本(熟语料库)
• 语料库是统计NLP的知识来源