five

skadnd/youtube_comment_sentiment_dataset_preprocessing

收藏
Hugging Face2025-12-12 更新2025-12-20 收录
下载链接:
https://hf-mirror.com/datasets/skadnd/youtube_comment_sentiment_dataset_preprocessing
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: cid dtype: string - name: text dtype: string - name: time dtype: string - name: author dtype: string - name: channel dtype: string - name: votes dtype: int64 - name: replies dtype: int64 - name: heart dtype: bool - name: reply dtype: bool - name: time_parsed dtype: float64 - name: source_video_id dtype: string - name: source_video_title dtype: string - name: text_length dtype: int64 - name: is_not_spam dtype: bool - name: votes_norm dtype: float64 - name: replies_norm dtype: float64 - name: heart_norm dtype: int64 - name: 검수_감정 dtype: string splits: - name: train num_bytes: 2867884 num_examples: 10035 download_size: 1091789 dataset_size: 2867884 configs: - config_name: default data_files: - split: train path: data/train-* ---

数据集元信息: 特征列: - 字段名:cid,数据类型:字符串 - 字段名:文本(text),数据类型:字符串 - 字段名:时间(time),数据类型:字符串 - 字段名:作者(author),数据类型:字符串 - 字段名:频道(channel),数据类型:字符串 - 字段名:点赞数(votes),数据类型:64位整数 - 字段名:回复数(replies),数据类型:64位整数 - 字段名:点赞标记(heart),数据类型:布尔型 - 字段名:回复标记(reply),数据类型:布尔型 - 字段名:解析后时间戳(time_parsed),数据类型:64位浮点型 - 字段名:源视频ID(source_video_id),数据类型:字符串 - 字段名:源视频标题(source_video_title),数据类型:字符串 - 字段名:文本长度(text_length),数据类型:64位整数 - 字段名:非垃圾信息标识(is_not_spam),数据类型:布尔型 - 字段名:归一化点赞数(votes_norm),数据类型:64位浮点型 - 字段名:归一化回复数(replies_norm),数据类型:64位浮点型 - 字段名:归一化点赞计数(heart_norm),数据类型:64位整数 - 字段名:校验情感(검수_감정),数据类型:字符串 数据拆分: - 拆分名称:train,字节占用量:2867884,样本数量:10035 下载大小:1091789 数据集总大小:2867884 数据集配置: - 配置名称:default,数据文件: - 拆分集:train,文件路径:data/train-*
提供机构:
skadnd
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作