基于规则的中文时间表达式识别与规范化 (2014年)

时间:2024-06-20 17:36:23
【文件属性】:

文件名称:基于规则的中文时间表达式识别与规范化 (2014年)

文件大小:762KB

文件格式:PDF

更新时间:2024-06-20 17:36:23

工程技术 论文

为了解决文本时间表达式的识别与规范化问题,针对时间表达式在形式上的多样性与非结构化,提出了对时态元素进行刻画的思想,划分时间表达式类别及规范形式;在此基础上,采用正则表达式与Trie树结构相结合的方式构建出时间短语识别树,自动进行中文时间表达式的识别与分类;最后,提出规范化算法与修正算法处理识别后的结果,得到规范化形式. 以中文语料进行实验,中文表达式识别与规范化工作达到较好的效果.


网友评论