ResumeRise:用于分类和汇总简历的NLP工具

时间:2021-05-23 19:18:05
【文件属性】:
文件名称:ResumeRise:用于分类和汇总简历的NLP工具
文件大小:8.42MB
文件格式:ZIP
更新时间:2021-05-23 19:18:05
nlp machine-learning ocr nltk tf-idf 恢复上升 简历解析器和摘要器工具可对简历进行分类,并根据用户要求对简历进行排名。 数据集 包含1000个以csv格式标记的简历(根据特定简历所属的主要类别/类别进行标记)。 我们将使用此csv格式的简历数据集来训练我们的模型以进行分类。 然后,我们的模型应该能够处理任何看不见的简历。 参考文件: Utils / Analysis.ipynb :数据清理+预处理+可视化+见解 Utils / Summarize.ipynb :恢复汇总算法 Utils / pdftotext.ipynb :使用pdfminer将odf转换为文本 Utils / Modelling.ipynb :主文件+代表性更改+培训+模型比较+测试 Utils / naive_bayes.ipynb :多项朴素贝叶斯实现 Utils / svm.ipynb :svm实现 Utils / clean_data1.csv :
【文件预览】:
ResumeRise-master
----.gitignore(1KB)
----README.md(1KB)
----Data()
--------paper2.pdf(435KB)
--------.Rhistory(0B)
--------resume_dataset.csv(8.39MB)
--------paper1.pdf(428KB)
----sample_input.pdf(32KB)
----LICENSE(34KB)
----sumary_topics.txt(49B)
----Utils()
--------Resume Similarity.ipynb(153KB)
--------Modelling.ipynb(139KB)
--------clean_data1.csv(14.18MB)
--------aphrasewithanoun.py(629B)
--------svm.ipynb(9KB)
--------Analysis.ipynb(515KB)
--------pdftotext.ipynb(10KB)
--------testtokenize.py(425B)
--------naive_bayes.ipynb(10KB)
--------Summarize.ipynb(21KB)
--------try.txt(2KB)
--------clean_data.csv(28B)
----Literature Survey()
--------INSIGHT_LiteratureSurvey.pdf(100KB)
----Final Report()
--------INSIGHT_FinalReport.pdf(200KB)
----requirements.txt(28B)

网友评论