程序员考试刷题-Stack-Resys:问题推荐

时间:2024-07-27 05:32:25
【文件属性】:

文件名称:程序员考试刷题-Stack-Resys:问题推荐

文件大小:228KB

文件格式:ZIP

更新时间:2024-07-27 05:32:25

系统开源

程序员考试刷题概述 作为全球最受欢迎的程序员问答社区,*.com 是标签系统成功使用的一个展示,每个问题可以有一个或多个问题来表明其“主题”。 直观地,我们可以将文本视为标签上的分布。 在这个项目中,我们的目标是通过挖掘大量标记问题来预测问题的标签。 此外,高精度的标签预测器还使我们能够发现用户对问题的“品味”。 我们可以通过检查用户问/回答/喜欢/投票的问题来估计用户在每个标签中的兴趣(由十进制向量表示)。 因此,我们可以使用这些信息来推荐新问题或发现其他具有相似兴趣的用户。 数据集 * 已在通用创意许可证下发布了他们的数据集。 该数据集包含超过 220 万个问题、480 万个答案和 3 万个标签,为我们的分析提供了丰富的内容。 方法 在这个项目中,我们通过朴素贝叶斯模型和 k 最近邻模型来解决这些问题。 特别是,通过分析原始方法的优缺点,我们对两种模型都提出了改进,这显着提升了标签预测的整体性能。 实验结果表明,所提出的模型在召回率和精度方面都比基线方法高出 20% 以上。 评价 标签预测的一大挑战是标签通常非常主观且不完整。 因此,


【文件预览】:
Stack-Resys-master
----LICENCE(1KB)
----src()
--------naive_bayes()
--------data-processing()
--------wiki_synonyms()
--------evaluation()
----doc()
--------midway()
--------proposal()
--------.gitignore(20B)
--------final_report()
----.gitignore(91B)
----README.md(3KB)

网友评论