five

SocialGrep/one-year-of-tsla-on-reddit

收藏
Hugging Face2022-07-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/SocialGrep/one-year-of-tsla-on-reddit
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含一年内Reddit上关于特斯拉公司(TSLA)的帖子和评论。数据点分为帖子和评论两种类型,每种类型有不同的字段。数据集的语言主要是英语,许可证为CC-BY v4.0。
提供机构:
SocialGrep
原始信息汇总

数据集概述

数据集基本信息

  • 名称: one-year-of-tsla-on-reddit
  • 语言: 英语
  • 许可证: CC-BY 4.0
  • 多语言性: 单语种
  • 数据集大小: 10万<n<100万
  • 数据来源: 原始数据

数据集描述

数据集摘要

包含一年内Reddit上提及特斯拉公司(TSLA)的帖子和评论。

支持的任务和排行榜

未明确提及。

语言

主要为英语。

数据集结构

数据实例

数据点为帖子或评论,分别存储在两个不同的文件中。

数据字段

  • 帖子字段:

    • type: 数据点类型,post 或 comment。
    • id: Reddit ID,以base-36表示。
    • subreddit.id: 所属子论坛的Reddit ID,以base-36表示。
    • subreddit.name: 所属子论坛的名称。
    • subreddit.nsfw: 是否为成人内容。
    • created_utc: 创建时间,UTC时间戳。
    • permalink: Reddit上的链接。
    • score: 帖子得分。
    • domain: 链接域名。
    • url: 链接目标地址。
    • selftext: 帖子内容。
    • title: 帖子标题。
  • 评论字段:

    • body: 评论内容。
    • sentiment: 内部情感分析结果。

数据集创建

来源数据

数据来源于Reddit。

注释

由lexyr创建。

个人和敏感信息

未提及。

使用数据集的考虑

社会影响

未提及。

偏见讨论

未提及。

其他已知限制

未提及。

附加信息

许可证信息

数据集遵循CC-BY 4.0许可证。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作