文件名称:使用职位描述的职位名称机器学习分类技术的性能比较-研究论文
文件大小:590KB
文件格式:PDF
更新时间:2024-06-08 11:43:54
TF-IDF LSVM BNB MNB RF
入围不当的候选者和可能错过的候选者只是意味着与不正确的关键字相关联的不当简历。 这些天来,由于对文本分类的兴趣日益浓厚,对文件分类的研究越来越多,而文本分类已成为在线文本和文档的主要贡献者。 机器可以使用专家系统来处理人员对细节进行分类的重复任务,该专家系统可以正确捕获和识别文本,然后将其分类为已定义的不同类别。 在对数据进行预处理之后,对贝努利的朴素贝叶斯,多项朴素贝叶斯,随机森林,线性SVM和LSVM进行了比较分析,并在前30个具有不同参数的Job Listing数据集上进行了弹性惩罚分类,因此我们能够分析具有不同密度和科目的类中不同术语之间的依赖关系。 评估了准确性,并且LSVM根据提交的查询在对职称进行分类时提供了最佳准确性,并且能够对55000个样本实现96.25%的准确性。