derek-thomas/dataset-creator-reddit-amitheasshole
收藏Hugging Face2023-12-04 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/derek-thomas/dataset-creator-reddit-amitheasshole
下载链接
链接失效反馈官方服务:
资源简介:
该数据集旨在提供一个开放的[r/amitheasshole](https://www.reddit.com/r/amitheasshole/)提交内容数据集。利用PRAW和Reddit API进行下载。由于API调用限制每次最多1000条,并且搜索功能有限,因此每小时运行一次以获取新的提交。数据集每小时更新一次,最近一次更新添加了200行新数据。根据Reddit的许可条款,用户内容归用户所有,Reddit授予有限的许可来复制和显示用户内容,但禁止用于训练机器学习或AI模型,除非获得权利持有者的明确许可。
提供机构:
derek-thomas
原始信息汇总
数据集概述
该数据集的目标是收集并公开 r/amitheasshole 提交的内容。数据集通过 PRAW 和 Reddit API 进行下载,但由于 API 调用限制为 1000 条,且搜索功能有限,因此每小时运行一次以获取新提交的内容。
创建详情
该数据集由 derek-thomas/dataset-creator-reddit-amitheasshole 创建。
更新频率
数据集每小时更新一次,最近一次更新时间为 2023-12-04 12:00:00 UTC+0000,新增了 200 行数据。
许可
数据集遵循 Reddit 许可条款,截至 2023 年 10 月 25 日:
用户通过我们的服务创建或提交的内容(“用户内容”)归用户所有,而非 Reddit 所有。在您完全且持续遵守数据 API 条款的前提下,Reddit 授予您非独占、不可转让、不可再授权、可撤销的许可,允许您使用数据 API 复制和显示用户内容,仅限于开发、部署、分发和运行您的应用程序给您的应用程序用户。您不得修改用户内容,除非是为了格式化显示。您将遵守用户内容所有者施加的任何要求或限制,这可能包括“保留所有权利”通知、Creative Commons 许可或其他双方可能达成的条款和条件。除非本节明确允许,否则不得授予或推定任何其他权利或许可,包括未经用户内容权利人明确许可,不得将用户内容用于其他目的,例如训练机器学习或 AI 模型。
个人理解是,未经许可,不能将此数据用于训练。
退出
如需退出此数据集,请在社区标签页提出请求。



