文件名称:作者身份归因:机器学习的作者身份归因
文件大小:3.04MB
文件格式:ZIP
更新时间:2024-02-24 19:21:11
machine-learning random-forest scikit-learn cybersecurity authorship-attribution
机器学习的作者身份归属 具有随机森林和TFIDF分数的作者身份归因 该存储库包含博客文章《 代码。 它使用随机森林模型以及TFIDF分数作为特征,在n个作者之间执行作者身份分类。 文件说明 路径 描述 作者属性 主文件夹。 └sample_data 包含作者数据的文件夹。 ├authors_folders 每个作者一个文件夹。 ├authors_article_0.txt 作者的第一篇文章。 ├authors_article_1.txt 第二篇。 ├... authors_article_n.txt ...上一篇文章。 ├attribution_model.py 作者