基于机器学习的文本分类技术研究进展9pdf)

时间:2012-06-30 12:35:19
【文件属性】:

文件名称:基于机器学习的文本分类技术研究进展9pdf)

文件大小:420KB

文件格式:PDF

更新时间:2012-06-30 12:35:19

基于机器学习的文本分类技术研究进展(论文)

摘 要: 文本自动分类是信息检索与数据挖掘领域的研究热点与核心技术,近年来得到了广泛的关注和快速 的发展.提出了基于机器学习的文本分类技术所面临的互联网内容信息处理等复杂应用的挑战,从模型、算法和 评测等方面对其研究进展进行综述评论.认为非线性、数据集偏斜、标注瓶颈、多层分类、算法的扩展性及 Web 页分类等问题是目前文本分类研究的关键问题,并讨论了这些问题可能采取的方法.最后对研究的方向进 行了展望. 关键词: 自动文本分类;机器学习;降维;核方法;未标注集;偏斜数据集;分级分类;大规模文本分类;Web页分类


网友评论

  • 仔仔细细的看了