SocialGrep/reddit-wallstreetbets-aug-2021
收藏Hugging Face2022-07-01 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/SocialGrep/reddit-wallstreetbets-aug-2021
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含了2021年8月期间在Reddit子论坛/r/WallStreetBets上的所有活动数据。数据包括帖子和评论,分别存储在两个不同的文件中。数据集主要使用英语,数据字段包括类型、ID、子论坛信息、创建时间、链接等。
提供机构:
SocialGrep
原始信息汇总
数据集概述
数据集基本信息
- 数据集名称: reddit-wallstreetbets-aug-2021
- 语言: 英语
- 许可证: CC-BY 4.0
- 多语言性: 单语种
- 数据集大小: 1M<n<10M
- 数据来源: 原始数据
数据集描述
数据集摘要
该数据集包含了2021年8月整个子版块/r/WallStreetBets的活动数据。
支持的任务和排行榜
[未提供]
语言
主要为英语。
数据集结构
数据实例
数据点包括帖子和评论,分别存储在不同的文件中。
数据字段
-
type: 数据点类型,可以是post或comment。
-
id: 数据点的Reddit ID,以base-36表示。
-
subreddit.id: 数据点所在子版块的Reddit ID,以base-36表示。
-
subreddit.name: 数据点所在子版块的人类可读名称。
-
subreddit.nsfw: 标记数据点所在子版块是否为NSFW。
-
created_utc: 数据点的UTC时间戳。
-
permalink: 数据点在Reddit上的链接。
-
domain (仅限帖子): 帖子链接的域名。
-
url (仅限帖子): 帖子链接的目标地址。
-
selftext (仅限帖子): 帖子的自文本。
-
title (仅限帖子): 帖子的标题。
-
body (仅限评论): 评论的内容。
-
sentiment (仅限评论): 内部情感分析的结果。
数据集创建
来源数据
[未提供详细信息]
注释
[未提供详细信息]
个人和敏感信息
[未提供详细信息]
使用数据集的考虑因素
社会影响
[未提供详细信息]
偏见讨论
[未提供详细信息]
其他已知限制
[未提供详细信息]
附加信息
数据集管理员
[未提供详细信息]
许可证信息
CC-BY v4.0
贡献
[未提供详细信息]



