five

derek-thomas/dataset-creator-reddit-amitheasshole

收藏
Hugging Face2023-12-04 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/derek-thomas/dataset-creator-reddit-amitheasshole
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集旨在提供一个开放的[r/amitheasshole](https://www.reddit.com/r/amitheasshole/)提交内容数据集。利用PRAW和Reddit API进行下载。由于API调用限制每次最多1000条,并且搜索功能有限,因此每小时运行一次以获取新的提交。数据集每小时更新一次,最近一次更新添加了200行新数据。根据Reddit的许可条款,用户内容归用户所有,Reddit授予有限的许可来复制和显示用户内容,但禁止用于训练机器学习或AI模型,除非获得权利持有者的明确许可。
提供机构:
derek-thomas
原始信息汇总

数据集概述

该数据集的目标是收集并公开 r/amitheasshole 提交的内容。数据集通过 PRAW 和 Reddit API 进行下载,但由于 API 调用限制为 1000 条,且搜索功能有限,因此每小时运行一次以获取新提交的内容。

创建详情

该数据集由 derek-thomas/dataset-creator-reddit-amitheasshole 创建。

更新频率

数据集每小时更新一次,最近一次更新时间为 2023-12-04 12:00:00 UTC+0000,新增了 200 行数据。

许可

数据集遵循 Reddit 许可条款,截至 2023 年 10 月 25 日:

用户通过我们的服务创建或提交的内容(“用户内容”)归用户所有,而非 Reddit 所有。在您完全且持续遵守数据 API 条款的前提下,Reddit 授予您非独占、不可转让、不可再授权、可撤销的许可,允许您使用数据 API 复制和显示用户内容,仅限于开发、部署、分发和运行您的应用程序给您的应用程序用户。您不得修改用户内容,除非是为了格式化显示。您将遵守用户内容所有者施加的任何要求或限制,这可能包括“保留所有权利”通知、Creative Commons 许可或其他双方可能达成的条款和条件。除非本节明确允许,否则不得授予或推定任何其他权利或许可,包括未经用户内容权利人明确许可,不得将用户内容用于其他目的,例如训练机器学习或 AI 模型。

个人理解是,未经许可,不能将此数据用于训练。

退出

如需退出此数据集,请在社区标签页提出请求。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作