论文研究-基于分层选择策略的主动学习分词方法.pdf

时间:2022-08-11 13:41:11
【文件属性】:
文件名称:论文研究-基于分层选择策略的主动学习分词方法.pdf
文件大小:1.12MB
文件格式:PDF
更新时间:2022-08-11 13:41:11
中文分词,主动学习,不确定性取样,分层取样策略 为了克服训练样本不足、获取大量标注样本费时费力的问题,在基于不确定选择策略的基础上,提出了一种新的基于分层选择策略的主动学习方法。使用新提出的选择策略从大量无标注的样本中选择最有价值的样例,进行标注后加入到训练集中来训练分词器。最后在PKU、MSR和山西大学数据集上进行测试,并与不确定选择策略进行比较。结果表明提出的分层选择策略在相同大小的训练语料下可以获得更高的分词准确率,同时还降低了人工标注的代价。

网友评论