SocialGrep/one-year-of-tsla-on-reddit
收藏Hugging Face2022-07-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/SocialGrep/one-year-of-tsla-on-reddit
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含一年内Reddit上关于特斯拉公司(TSLA)的帖子和评论。数据点分为帖子和评论两种类型,每种类型有不同的字段。数据集的语言主要是英语,许可证为CC-BY v4.0。
提供机构:
SocialGrep
原始信息汇总
数据集概述
数据集基本信息
- 名称: one-year-of-tsla-on-reddit
- 语言: 英语
- 许可证: CC-BY 4.0
- 多语言性: 单语种
- 数据集大小: 10万<n<100万
- 数据来源: 原始数据
数据集描述
数据集摘要
包含一年内Reddit上提及特斯拉公司(TSLA)的帖子和评论。
支持的任务和排行榜
未明确提及。
语言
主要为英语。
数据集结构
数据实例
数据点为帖子或评论,分别存储在两个不同的文件中。
数据字段
-
帖子字段:
- type: 数据点类型,post 或 comment。
- id: Reddit ID,以base-36表示。
- subreddit.id: 所属子论坛的Reddit ID,以base-36表示。
- subreddit.name: 所属子论坛的名称。
- subreddit.nsfw: 是否为成人内容。
- created_utc: 创建时间,UTC时间戳。
- permalink: Reddit上的链接。
- score: 帖子得分。
- domain: 链接域名。
- url: 链接目标地址。
- selftext: 帖子内容。
- title: 帖子标题。
-
评论字段:
- body: 评论内容。
- sentiment: 内部情感分析结果。
数据集创建
来源数据
数据来源于Reddit。
注释
由lexyr创建。
个人和敏感信息
未提及。
使用数据集的考虑
社会影响
未提及。
偏见讨论
未提及。
其他已知限制
未提及。
附加信息
许可证信息
数据集遵循CC-BY 4.0许可证。



