文件名称:reddit_ml_challenge:Reddit机器学习
文件大小:1.22MB
文件格式:ZIP
更新时间:2024-05-30 11:15:12
Python
Reddit机器学习:标记挑战 该竞赛使用和进行托管和免费运行! 截止日期:2018年7月1日 描述 任务是学习自动为每个标题分配一个标签(“研究”,“项目”,“新闻”,“讨论”)。 数据是从此收集的。 出于以下两个原因,学习分类器非常有用: 自动分类新帖子 对过去没有标签的帖子进行分类 您所需要做的就是实现sol.py (请参阅的示例)并执行拉取请求! 有关完整信息,请参见。 奖 在截止日期结束前,此仓库中列出了前三名: # 名称 分数 1个 0.6404 2个 0.6284 3 0.5629 您也可以查看 也许subreddit托管者可以使用该模型? 如何竞争? 示例解决方案之一仅需要14行Python。 在Github上分叉存储库。 mkdir challenge/solutions/my_solution 调整challenge/solutions
【文件预览】:
reddit_ml_challenge-master
----.travis.yml(189B)
----get_data_queries.sql(897B)
----Dockerfile(310B)
----resources()
--------screenshot1.png(263KB)
----challenge()
--------data()
--------calculate.py(373B)
--------data_processing.py(831B)
--------reproducible_seed.py(435B)
--------solutions()
--------test_solution.py(260B)
----requirements.txt(50B)
----.gitignore(13B)
----README.md(3KB)
----full_leaderboard.md(204B)