derek-thomas/dataset-creator-reddit-bestofredditorupdates
收藏Hugging Face2024-05-17 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/derek-thomas/dataset-creator-reddit-bestofredditorupdates
下载链接
链接失效反馈官方服务:
资源简介:
该数据集的目标是收集Reddit子论坛r/bestofredditorupdates的提交内容,使用PRAW和Reddit API进行下载。由于API调用有1000条的限制和有限的搜索功能,因此每天运行以获取新的提交内容。数据集每天更新,最近一次更新是在2024年5月17日08:00:00 UTC+0000,添加了36条新记录。数据集的特征包括id、内容、评分、日期、标题、标签、发布者、永久链接、更新状态和新状态。数据集的分割包括训练集,大小为79483376字节,包含11595个示例。
提供机构:
derek-thomas
原始信息汇总
数据集概述
数据集特征
- id: 字符串类型
- content: 字符串类型
- score: 整数类型
- date_utc: 时间戳类型
- title: 字符串类型
- flair: 字符串类型
- poster: 字符串类型
- permalink: 字符串类型
- updated: 布尔类型
- new: 布尔类型
数据集分割
- train:
- 数据量: 79483376 字节
- 示例数量: 11595
数据集大小
- 下载大小: 46344789 字节
- 数据集大小: 79483376 字节
配置
- config_name: default
- data_files:
- split: train
- path: data/train-*



