ramya-ml/hpdv2_test_cliph
收藏Hugging Face2024-04-28 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/ramya-ml/hpdv2_test_cliph
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含用户对图像对的偏好信息,每个记录包括用户ID、提示文本、左右图像ID、嵌入模型名称、文本嵌入、图像对嵌入、偏好评分和排名ID。数据集分为训练集、测试集和验证集,分别包含114750、19125和19125个样本。数据集的总大小为1906342830.0字节,下载大小为1917758959字节。
该数据集包含用户对图像对的偏好信息,每个记录包括用户ID、提示文本、左右图像ID、嵌入模型名称、文本嵌入、图像对嵌入、偏好评分和排名ID。数据集分为训练集、测试集和验证集,分别包含114750、19125和19125个样本。数据集的总大小为1906342830.0字节,下载大小为1917758959字节。
提供机构:
ramya-ml
原始信息汇总
数据集概述
数据集特征
- user_id:整数类型
- prompt:字符串类型
- image_left_id:字符串类型
- image_right_id:字符串类型
- embedding_model:字符串类型
- text_embeds:序列类型,序列元素为浮点数
- image_pair_embeds:序列类型,序列元素为浮点数
- pref:整数类型
- ranking_id:字符串类型
数据集分割
- 训练集:
- 样本数量:114750
- 数据大小:1429757122.5字节
- 测试集:
- 样本数量:19125
- 数据大小:238292853.75字节
- 验证集:
- 样本数量:19125
- 数据大小:238292853.75字节
数据集大小
- 下载大小:1917758959字节
- 数据集总大小:1906342830.0字节
数据文件配置
- 默认配置:
- 训练集路径:data/train-*
- 测试集路径:data/test-*
- 验证集路径:data/validation-*



