中文微博实体链接研究 (2014年)

时间:2024-07-02 09:06:26
【文件属性】:

文件名称:中文微博实体链接研究 (2014年)

文件大小:423KB

文件格式:PDF

更新时间:2024-07-02 09:06:26

自然科学 论文

针对2013年CCF自然语言处理与中文计算会议(NLP&CC2013)中文微博实体链接的任务,使用CCF提供的新浪微博数据作为训练和测试数据,利用西南交通大学耶宝智慧中文分词平台作为自然语言预处理工具,提出一种实体链接的方法。该方法应用改进的拼音编辑距离算法和后缀词表匹配法,提出实体聚类消歧与基于百度百科词频的同类实体消歧相结合的消歧方法。在2013年CCF中文微博实体链接评测任务中正确结果的准确率为0.8838,在10个参赛队伍中名列第3位。表明该方法有效并可以适应文本中的噪声。


网友评论