ICTPOS3.0汉语词性标记集

时间:2017-09-24 10:03:14
【文件属性】:
文件名称:ICTPOS3.0汉语词性标记集
文件大小:61KB
文件格式:DOC
更新时间:2017-09-24 10:03:14
词性 分词 计算所汉语词性标记集(共计99个,22个一类,66个二类,11个三类)主要用于中国科学院计算技术研究所研制的汉语词法分析器、句法分析器和汉英机器翻译系统。本标记集主要参考了以下词性标记集: 1. 北大《人民日报》语料库词性标记集; 2. 北大2002新版词性标记集(草稿); 3. 清华大学汉语树库词性标记集; 4. 教育部语用所词性标记集(国家推荐标准草案2002版); 5. 美国宾州大学中文树库(ChinesePennTreeBank)词性标记集;

网友评论