JayHyeon/SHP_split_11
收藏Hugging Face2024-07-15 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/JayHyeon/SHP_split_11
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个字段,主要涉及帖子ID、域名、点赞比例、历史记录、两个根评论ID、创建时间、评分、人工参考信息、标签、时间差和评分比例等。数据集包含5000个训练样本,文件总大小为10593209字节,下载大小为3633746字节。
The dataset includes multiple fields, mainly involving post ID, domain, upvote ratio, history, two root comment IDs, creation time, scores, human reference information, labels, time difference, and score ratio. The dataset contains 5000 training samples, with a total file size of 10593209 bytes and a download size of 3633746 bytes.
提供机构:
JayHyeon
原始信息汇总
数据集概述
数据集特征
- post_id: 帖子ID,数据类型为字符串。
- domain: 域名,数据类型为字符串。
- upvote_ratio: 点赞比率,数据类型为浮点数。
- history: 历史记录,数据类型为字符串。
- c_root_id_A: 根ID A,数据类型为字符串。
- c_root_id_B: 根ID B,数据类型为字符串。
- created_at_utc_A: 创建时间 A(UTC),数据类型为整数。
- created_at_utc_B: 创建时间 B(UTC),数据类型为整数。
- score_A: 分数 A,数据类型为整数。
- score_B: 分数 B,数据类型为整数。
- human_ref_A: 人类参考 A,数据类型为字符串。
- human_ref_B: 人类参考 B,数据类型为字符串。
- labels: 标签,数据类型为整数。
- seconds_difference: 时间差(秒),数据类型为浮点数。
- score_ratio: 分数比率,数据类型为浮点数。
数据集划分
- train: 训练集,包含5000个样本,总大小为10593209字节。
数据集大小
- 下载大小: 3633746字节。
- 数据集总大小: 10593209字节。
配置
- default: 默认配置,包含训练集数据文件路径为
data/train-*。



