SarcasmNet/self-annotated_reddit_climate_comment
收藏数据集卡片:Self-annotated Reddit Climate Comment
数据集概述
- 许可证: MIT
- 语言: 英语
- 标签: 气候, 环境, Reddit, 评论, 讽刺, 自注释
- 美观名称: Self-AnnotatedRedditClimateComment
- 数据集大小: 580kb
- 分割: 训练集
数据集结构
数据集以JSON格式存储,示例如下:
json { "id": "1006cei", "post_title": "Amazing Water Filter Invention", "post_author": "User123", "post_body": "Check out this incredible water filter!", "post_url": "https://example.com/water_filter", "post_pic": "https://example.com/images/water_filter.jpg", "subreddit": "inventions", "post_timestamp": "2023-01-01T12:00:00Z", "post_upvotes": 123, "post_permalink": "/r/inventions/comments/1006cei/amazing_water_filter_invention/", "comments": { "CommentID": ["abc123", "def456"], "CommentAuthor": ["User456", "User789"], "CommentBody": ["This is awesome!", "How does it work?"], "CommentTimestamp": ["2023-01-01T12:30:00Z", "2023-01-01T13:00:00Z"], "CommentUpvotes": [5, 7], "CommentPermalink": ["/r/inventions/comments/1006cei/amazing_water_filter_invention/abc123/", "/r/inventions/comments/1006cei/amazing_water_filter_invention/def456/"], "Label": [1,0] ] } }
字段说明
- id: 字符串 - 帖子的唯一标识符。
- post_title: 字符串 - 帖子的标题。
- post_author: 字符串 - 发布帖子的用户名。
- post_body: 字符串 - 帖子的内容。
- post_url: 字符串 - 帖子的URL。
- post_pic: 图像 - 帖子关联的图像。
- subreddit: 字符串 - 帖子发布的子版块。
- post_timestamp: 字符串 - 帖子发布的时间戳。
- post_upvotes: 整数 - 帖子收到的点赞数。
- post_permalink: 字符串 - 帖子的永久链接。
- comments: 序列 - 与帖子关联的评论序列。
- CommentID: 字符串 - 评论的唯一标识符。
- CommentAuthor: 字符串 - 评论作者的用户名。
- CommentBody: 字符串 - 评论的内容。
- CommentTimestamp: 字符串 - 评论发布的时间戳。
- CommentUpvotes: 整数 - 评论收到的点赞数。
- CommentPermalink: 字符串 - 评论的永久链接。
- Label: 整数 - 评论的讽刺标签(1表示讽刺,0表示中性)。
引用
bibtex @InProceedings{huggingface:dataset, title = {Self-annotated Reddit Climate Comment}, author={Catherine Wang, Ziyuan Ma}, year={2024} }



