yuvalkirstain/pickapic_v1_no_images
收藏Hugging Face2023-04-16 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/yuvalkirstain/pickapic_v1_no_images
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: are_different
dtype: bool
- name: best_image_uid
dtype: string
- name: caption
dtype: string
- name: created_at
dtype: timestamp[ns]
- name: has_label
dtype: bool
- name: image_0_uid
dtype: string
- name: image_0_url
dtype: string
- name: image_1_uid
dtype: string
- name: image_1_url
dtype: string
- name: label_0
dtype: float64
- name: label_1
dtype: float64
- name: model_0
dtype: string
- name: model_1
dtype: string
- name: ranking_id
dtype: int64
- name: user_id
dtype: int64
- name: num_example_per_prompt
dtype: int64
- name: __index_level_0__
dtype: int64
splits:
- name: train
num_bytes: 308923563
num_examples: 583747
- name: validation
num_bytes: 8759568
num_examples: 17439
- name: test
num_bytes: 7194410
num_examples: 14073
- name: validation_unique
num_bytes: 248229
num_examples: 500
- name: test_unique
num_bytes: 256313
num_examples: 500
download_size: 175013617
dataset_size: 325382083
---
# Dataset Card for "pick_a_pic_v1_no_images"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
---
数据集信息:
特征字段:
- 字段名: 是否不同(are_different), 数据类型: 布尔型(bool)
- 字段名: 最优图片唯一标识符(best_image_uid), 数据类型: 字符串型(string)
- 字段名: 图片描述文本(caption), 数据类型: 字符串型(string)
- 字段名: 创建时间(created_at), 数据类型: 纳秒级时间戳(timestamp[ns])
- 字段名: 是否包含标注(has_label), 数据类型: 布尔型(bool)
- 字段名: 图片0唯一标识符(image_0_uid), 数据类型: 字符串型(string)
- 字段名: 图片0访问链接(image_0_url), 数据类型: 字符串型(string)
- 字段名: 图片1唯一标识符(image_1_uid), 数据类型: 字符串型(string)
- 字段名: 图片1访问链接(image_1_url), 数据类型: 字符串型(string)
- 字段名: 标注0(label_0), 数据类型: 64位浮点型(float64)
- 字段名: 标注1(label_1), 数据类型: 64位浮点型(float64)
- 字段名: 模型0(model_0), 数据类型: 字符串型(string)
- 字段名: 模型1(model_1), 数据类型: 字符串型(string)
- 字段名: 排序唯一标识符(ranking_id), 数据类型: 64位整型(int64)
- 字段名: 用户唯一标识符(user_id), 数据类型: 64位整型(int64)
- 字段名: 单提示词样本数量(num_example_per_prompt), 数据类型: 64位整型(int64)
- 字段名: 索引层级0(__index_level_0__), 数据类型: 64位整型(int64)
数据划分:
- 划分名称: 训练集(train), 字节占用: 308923563, 样本数量: 583747
- 划分名称: 验证集(validation), 字节占用: 8759568, 样本数量: 17439
- 划分名称: 测试集(test), 字节占用: 7194410, 样本数量: 14073
- 划分名称: 唯一验证集(validation_unique), 字节占用: 248229, 样本数量: 500
- 划分名称: 唯一测试集(test_unique), 字节占用: 256313, 样本数量: 500
下载总大小: 175013617
数据集总存储大小: 325382083
---
# 数据集卡片:pick_a_pic_v1_no_images
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
yuvalkirstain
原始信息汇总
数据集概述
数据集特征
- are_different: 布尔类型
- best_image_uid: 字符串类型
- caption: 字符串类型
- created_at: 时间戳(纳秒)
- has_label: 布尔类型
- image_0_uid: 字符串类型
- image_0_url: 字符串类型
- image_1_uid: 字符串类型
- image_1_url: 字符串类型
- label_0: 浮点数类型
- label_1: 浮点数类型
- model_0: 字符串类型
- model_1: 字符串类型
- ranking_id: 整数类型
- user_id: 整数类型
- num_example_per_prompt: 整数类型
- index_level_0: 整数类型
数据集分割
- train: 583747个样本,308923563字节
- validation: 17439个样本,8759568字节
- test: 14073个样本,7194410字节
- validation_unique: 500个样本,248229字节
- test_unique: 500个样本,256313字节
数据集大小
- 下载大小: 175013617字节
- 数据集大小: 325382083字节
搜集汇总
数据集介绍

以上内容由遇见数据集搜集并总结生成



