Xiaohongshu AIGC Comments and Posts Dataset|AIGC数据集|社交媒体分析数据集
收藏Xiaohongshu AIGC Comments and Posts Dataset
数据集概述
该数据集从“小红书”平台收集,专注于用户生成的关于人工智能生成内容(AIGC)的内容。涵盖广告、汽车、时尚、食品、文学、印刷、体育和技术等多个类别。数据集包含用户评论和帖子,信息包括用户ID、内容、时间戳、点赞数和情感分析,可用于分析公众对AIGC的看法和态度。
数据结构
数据集按以下方式组织:
- 数据目录:数据集分为多个主题文件夹(例如,
ai-Advertisement、ai-technology),每个文件夹包含与该主题相关的评论和帖子数据。 - 文件结构:
Comments-<Theme>.csv:包含特定主题的用户评论。Post-<Theme>.csv:包含特定主题的帖子数据。
示例数据结构
例如,在ai-technology文件夹中,文件Comments-technological development.csv包含以下字段:
| 字段名 | 描述 |
|---|---|
| comment_id | 评论的唯一标识符 |
| create_time | 创建时间戳 |
| ip_location | 用户的IP位置 |
| note_id | 评论关联的帖子ID |
| content | 评论内容 |
| user_id | 用户的唯一标识符 |
| nickname | 用户的昵称 |
| avatar | 用户头像的链接 |
| sub_comment_count | 子评论的数量 |
| parent_comment_id | 父评论的ID |
| last_modify_ts | 最后修改时间戳 |
| like_count | 点赞数 |
| sentiment | 评论的情感(例如,正面、负面) |
示例数据
csv comment_id,create_time,ip_location,note_id,content,user_id,nickname,avatar,sub_comment_count,parent_comment_id,last_modify_ts,like_count,sentiment 658e7ddd000000001a00e241,1703837149000,,658e7d1d0000000012004a26,"Six fingers aren’t obvious enough?",608af36300000000010063ee,momo,"https://sns-avatar-qc.xhscdn.com/avatar/1040g2...",303,0,1728458720283,28k,positive 658ef186000000001702da48,1703866758000,,658e7d1d0000000012004a26,"With this body type, there would be no collarbones sitting like that",58de279582ec3932ec4c73b5,"Momo in Renovation","https://sns-avatar-qc.xhscdn.com/avatar/58de27...",1059,0,1728458720285,15k,positive

