getRedditDataset:允许用户从 reddit 中获取数据集

时间:2024-07-06 15:34:17
【文件属性】:

文件名称:getRedditDataset:允许用户从 reddit 中获取数据集

文件大小:16KB

文件格式:ZIP

更新时间:2024-07-06 15:34:17

Python

获取Reddit数据集 此存储库使用 PRAW 从 reddit 创建自定义数据集。 PRAW/Reddit API 基础知识 这不是 PRAW 的教程。 如果您愿意,我建议您访问他们的。 本节将仅介绍从 reddit 创建数据集所需的 PRAW 基础知识。 首先,让我们导入 praw 和 redditDataset 模块 import praw import redditDataset 接下来,让我们初始化一个与 PRAW 的连接,如下所示: redditObject = praw.Reddit(user_agent='get_reddit_dataset') 我们可以使用getSubreddits获取 subreddits。 在这里,我们将获取 /r/funny 和 /r/gaming subreddits = redditDataset.getSubreddits(red


【文件预览】:
getRedditDataset-master
----LICENSE.txt(1KB)
----test.py(264B)
----Testing out reddit api.ipynb(19KB)
----redditDataset.py(6KB)
----Get reddit datasets.ipynb(1KB)
----README.md(4KB)
----redditDB.py(6KB)
----Get reddit data between dates.ipynb(5KB)
----.gitignore(2KB)

网友评论