skadnd/youtube_comment_sentiment_dataset_preprocessing
收藏Hugging Face2025-12-12 更新2025-12-20 收录
下载链接:
https://hf-mirror.com/datasets/skadnd/youtube_comment_sentiment_dataset_preprocessing
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: cid
dtype: string
- name: text
dtype: string
- name: time
dtype: string
- name: author
dtype: string
- name: channel
dtype: string
- name: votes
dtype: int64
- name: replies
dtype: int64
- name: heart
dtype: bool
- name: reply
dtype: bool
- name: time_parsed
dtype: float64
- name: source_video_id
dtype: string
- name: source_video_title
dtype: string
- name: text_length
dtype: int64
- name: is_not_spam
dtype: bool
- name: votes_norm
dtype: float64
- name: replies_norm
dtype: float64
- name: heart_norm
dtype: int64
- name: 검수_감정
dtype: string
splits:
- name: train
num_bytes: 2867884
num_examples: 10035
download_size: 1091789
dataset_size: 2867884
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
数据集元信息:
特征列:
- 字段名:cid,数据类型:字符串
- 字段名:文本(text),数据类型:字符串
- 字段名:时间(time),数据类型:字符串
- 字段名:作者(author),数据类型:字符串
- 字段名:频道(channel),数据类型:字符串
- 字段名:点赞数(votes),数据类型:64位整数
- 字段名:回复数(replies),数据类型:64位整数
- 字段名:点赞标记(heart),数据类型:布尔型
- 字段名:回复标记(reply),数据类型:布尔型
- 字段名:解析后时间戳(time_parsed),数据类型:64位浮点型
- 字段名:源视频ID(source_video_id),数据类型:字符串
- 字段名:源视频标题(source_video_title),数据类型:字符串
- 字段名:文本长度(text_length),数据类型:64位整数
- 字段名:非垃圾信息标识(is_not_spam),数据类型:布尔型
- 字段名:归一化点赞数(votes_norm),数据类型:64位浮点型
- 字段名:归一化回复数(replies_norm),数据类型:64位浮点型
- 字段名:归一化点赞计数(heart_norm),数据类型:64位整数
- 字段名:校验情感(검수_감정),数据类型:字符串
数据拆分:
- 拆分名称:train,字节占用量:2867884,样本数量:10035
下载大小:1091789
数据集总大小:2867884
数据集配置:
- 配置名称:default,数据文件:
- 拆分集:train,文件路径:data/train-*
提供机构:
skadnd



