five

SarcasmNet/self-annotated_reddit_climate_comment

收藏
Hugging Face2024-03-10 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/SarcasmNet/self-annotated_reddit_climate_comment
下载链接
链接失效反馈
官方服务:
资源简介:
Self-Annotated Reddit Climate Comment数据集是一个包含Reddit帖子及其评论的数据集,主要用于气候和环境相关的评论分析。数据集以JSON格式存储,包含帖子标题、作者、内容、URL、图片、子版块、时间戳、点赞数、永久链接等信息。评论部分包括评论ID、作者、内容、时间戳、点赞数、永久链接以及标签(用于标记评论是否为讽刺性评论)。该数据集特别适用于讽刺性评论的识别和分析。
提供机构:
SarcasmNet
原始信息汇总

数据集卡片:Self-annotated Reddit Climate Comment

数据集概述

  • 许可证: MIT
  • 语言: 英语
  • 标签: 气候, 环境, Reddit, 评论, 讽刺, 自注释
  • 美观名称: Self-AnnotatedRedditClimateComment
  • 数据集大小: 580kb
  • 分割: 训练集

数据集结构

数据集以JSON格式存储,示例如下:

json { "id": "1006cei", "post_title": "Amazing Water Filter Invention", "post_author": "User123", "post_body": "Check out this incredible water filter!", "post_url": "https://example.com/water_filter", "post_pic": "https://example.com/images/water_filter.jpg", "subreddit": "inventions", "post_timestamp": "2023-01-01T12:00:00Z", "post_upvotes": 123, "post_permalink": "/r/inventions/comments/1006cei/amazing_water_filter_invention/", "comments": { "CommentID": ["abc123", "def456"], "CommentAuthor": ["User456", "User789"], "CommentBody": ["This is awesome!", "How does it work?"], "CommentTimestamp": ["2023-01-01T12:30:00Z", "2023-01-01T13:00:00Z"], "CommentUpvotes": [5, 7], "CommentPermalink": ["/r/inventions/comments/1006cei/amazing_water_filter_invention/abc123/", "/r/inventions/comments/1006cei/amazing_water_filter_invention/def456/"], "Label": [1,0] ] } }

字段说明

  • id: 字符串 - 帖子的唯一标识符。
  • post_title: 字符串 - 帖子的标题。
  • post_author: 字符串 - 发布帖子的用户名。
  • post_body: 字符串 - 帖子的内容。
  • post_url: 字符串 - 帖子的URL。
  • post_pic: 图像 - 帖子关联的图像。
  • subreddit: 字符串 - 帖子发布的子版块。
  • post_timestamp: 字符串 - 帖子发布的时间戳。
  • post_upvotes: 整数 - 帖子收到的点赞数。
  • post_permalink: 字符串 - 帖子的永久链接。
  • comments: 序列 - 与帖子关联的评论序列。
    • CommentID: 字符串 - 评论的唯一标识符。
    • CommentAuthor: 字符串 - 评论作者的用户名。
    • CommentBody: 字符串 - 评论的内容。
    • CommentTimestamp: 字符串 - 评论发布的时间戳。
    • CommentUpvotes: 整数 - 评论收到的点赞数。
    • CommentPermalink: 字符串 - 评论的永久链接。
    • Label: 整数 - 评论的讽刺标签(1表示讽刺,0表示中性)。

引用

bibtex @InProceedings{huggingface:dataset, title = {Self-annotated Reddit Climate Comment}, author={Catherine Wang, Ziyuan Ma}, year={2024} }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作