文件名称:论文研究-话语标记的计量与自动过滤提取.pdf
文件大小:496KB
文件格式:PDF
更新时间:2022-10-01 16:29:18
论文研究
语篇中的话语标记在自然语言处理中逐渐得到重视。基于大规模语料库对话语标记进行自顶向下的梳理是该研究的目标。研究中构建了两个500万字次的语体语料库,利用UltraEdit等软件对话语标记进行提取和统计,对使用情况作了详细分析,发现话语标记并非只用于口语之中,每种语体都有自己的使用特色。在获得的话语标记的基础上,给出了在大规模语料库中提取算法并编程实现,减少了人工操作,提高了识别效率。