【文件属性】:
文件名称:getRedditDataset:允许用户从 reddit 中获取数据集
文件大小:16KB
文件格式:ZIP
更新时间:2021-06-16 21:47:37
Python
获取Reddit数据集
此存储库使用 PRAW 从 reddit 创建自定义数据集。
PRAW/Reddit API 基础知识
这不是 PRAW 的教程。 如果您愿意,我建议您访问他们的。 本节将仅介绍从 reddit 创建数据集所需的 PRAW 基础知识。
首先,让我们导入 praw 和 redditDataset 模块
import praw
import redditDataset
接下来,让我们初始化一个与 PRAW 的连接,如下所示:
redditObject = praw.Reddit(user_agent='get_reddit_dataset')
我们可以使用getSubreddits获取 subreddits。 在这里,我们将获取 /r/funny 和 /r/gaming
subreddits = redditDataset.getSubreddits(red
【文件预览】:
getRedditDataset-master
----LICENSE.txt(1KB)
----test.py(264B)
----Testing out reddit api.ipynb(19KB)
----redditDataset.py(6KB)
----Get reddit datasets.ipynb(1KB)
----README.md(4KB)
----redditDB.py(6KB)
----Get reddit data between dates.ipynb(5KB)
----.gitignore(2KB)