five

SocialGrep/reddit-wallstreetbets-aug-2021

收藏
Hugging Face2022-07-01 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/SocialGrep/reddit-wallstreetbets-aug-2021
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含了2021年8月期间在Reddit子论坛/r/WallStreetBets上的所有活动数据。数据包括帖子和评论,分别存储在两个不同的文件中。数据集主要使用英语,数据字段包括类型、ID、子论坛信息、创建时间、链接等。
提供机构:
SocialGrep
原始信息汇总

数据集概述

数据集基本信息

  • 数据集名称: reddit-wallstreetbets-aug-2021
  • 语言: 英语
  • 许可证: CC-BY 4.0
  • 多语言性: 单语种
  • 数据集大小: 1M<n<10M
  • 数据来源: 原始数据

数据集描述

数据集摘要

该数据集包含了2021年8月整个子版块/r/WallStreetBets的活动数据。

支持的任务和排行榜

[未提供]

语言

主要为英语。

数据集结构

数据实例

数据点包括帖子和评论,分别存储在不同的文件中。

数据字段

  • type: 数据点类型,可以是post或comment。

  • id: 数据点的Reddit ID,以base-36表示。

  • subreddit.id: 数据点所在子版块的Reddit ID,以base-36表示。

  • subreddit.name: 数据点所在子版块的人类可读名称。

  • subreddit.nsfw: 标记数据点所在子版块是否为NSFW。

  • created_utc: 数据点的UTC时间戳。

  • permalink: 数据点在Reddit上的链接。

  • domain (仅限帖子): 帖子链接的域名。

  • url (仅限帖子): 帖子链接的目标地址。

  • selftext (仅限帖子): 帖子的自文本。

  • title (仅限帖子): 帖子的标题。

  • body (仅限评论): 评论的内容。

  • sentiment (仅限评论): 内部情感分析的结果。

数据集创建

来源数据

[未提供详细信息]

注释

[未提供详细信息]

个人和敏感信息

[未提供详细信息]

使用数据集的考虑因素

社会影响

[未提供详细信息]

偏见讨论

[未提供详细信息]

其他已知限制

[未提供详细信息]

附加信息

数据集管理员

[未提供详细信息]

许可证信息

CC-BY v4.0

贡献

[未提供详细信息]

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作