论文研究-藏文语料库深加工方法研究.pdf

时间:2022-10-02 16:21:51
【文件属性】:
文件名称:论文研究-藏文语料库深加工方法研究.pdf
文件大小:486KB
文件格式:PDF
更新时间:2022-10-02 16:21:51
论文研究 随着自然语言信息处理的不断发展和完善,大规模语料文本处理已经成为计算语言学界的一个热门话题。一个重要的原因是从大规模的语料库中能够提取出所需要的知识。结合973前期项目《藏文语料库分词标注规范研究》的开发经验,论述了班智达大型藏文语料库的建设,分词标注词典库和分词标注软件的设计与实现,重点讨论了词典库的索引结构及查找算法、分词标注软件的格词分块匹配算法和还原算法。

网友评论