five

yuvalkirstain/pickapic_v1_no_images

收藏
Hugging Face2023-04-16 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/yuvalkirstain/pickapic_v1_no_images
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: are_different dtype: bool - name: best_image_uid dtype: string - name: caption dtype: string - name: created_at dtype: timestamp[ns] - name: has_label dtype: bool - name: image_0_uid dtype: string - name: image_0_url dtype: string - name: image_1_uid dtype: string - name: image_1_url dtype: string - name: label_0 dtype: float64 - name: label_1 dtype: float64 - name: model_0 dtype: string - name: model_1 dtype: string - name: ranking_id dtype: int64 - name: user_id dtype: int64 - name: num_example_per_prompt dtype: int64 - name: __index_level_0__ dtype: int64 splits: - name: train num_bytes: 308923563 num_examples: 583747 - name: validation num_bytes: 8759568 num_examples: 17439 - name: test num_bytes: 7194410 num_examples: 14073 - name: validation_unique num_bytes: 248229 num_examples: 500 - name: test_unique num_bytes: 256313 num_examples: 500 download_size: 175013617 dataset_size: 325382083 --- # Dataset Card for "pick_a_pic_v1_no_images" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)

--- 数据集信息: 特征字段: - 字段名: 是否不同(are_different), 数据类型: 布尔型(bool) - 字段名: 最优图片唯一标识符(best_image_uid), 数据类型: 字符串型(string) - 字段名: 图片描述文本(caption), 数据类型: 字符串型(string) - 字段名: 创建时间(created_at), 数据类型: 纳秒级时间戳(timestamp[ns]) - 字段名: 是否包含标注(has_label), 数据类型: 布尔型(bool) - 字段名: 图片0唯一标识符(image_0_uid), 数据类型: 字符串型(string) - 字段名: 图片0访问链接(image_0_url), 数据类型: 字符串型(string) - 字段名: 图片1唯一标识符(image_1_uid), 数据类型: 字符串型(string) - 字段名: 图片1访问链接(image_1_url), 数据类型: 字符串型(string) - 字段名: 标注0(label_0), 数据类型: 64位浮点型(float64) - 字段名: 标注1(label_1), 数据类型: 64位浮点型(float64) - 字段名: 模型0(model_0), 数据类型: 字符串型(string) - 字段名: 模型1(model_1), 数据类型: 字符串型(string) - 字段名: 排序唯一标识符(ranking_id), 数据类型: 64位整型(int64) - 字段名: 用户唯一标识符(user_id), 数据类型: 64位整型(int64) - 字段名: 单提示词样本数量(num_example_per_prompt), 数据类型: 64位整型(int64) - 字段名: 索引层级0(__index_level_0__), 数据类型: 64位整型(int64) 数据划分: - 划分名称: 训练集(train), 字节占用: 308923563, 样本数量: 583747 - 划分名称: 验证集(validation), 字节占用: 8759568, 样本数量: 17439 - 划分名称: 测试集(test), 字节占用: 7194410, 样本数量: 14073 - 划分名称: 唯一验证集(validation_unique), 字节占用: 248229, 样本数量: 500 - 划分名称: 唯一测试集(test_unique), 字节占用: 256313, 样本数量: 500 下载总大小: 175013617 数据集总存储大小: 325382083 --- # 数据集卡片:pick_a_pic_v1_no_images [需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
yuvalkirstain
原始信息汇总

数据集概述

数据集特征

  • are_different: 布尔类型
  • best_image_uid: 字符串类型
  • caption: 字符串类型
  • created_at: 时间戳(纳秒)
  • has_label: 布尔类型
  • image_0_uid: 字符串类型
  • image_0_url: 字符串类型
  • image_1_uid: 字符串类型
  • image_1_url: 字符串类型
  • label_0: 浮点数类型
  • label_1: 浮点数类型
  • model_0: 字符串类型
  • model_1: 字符串类型
  • ranking_id: 整数类型
  • user_id: 整数类型
  • num_example_per_prompt: 整数类型
  • index_level_0: 整数类型

数据集分割

  • train: 583747个样本,308923563字节
  • validation: 17439个样本,8759568字节
  • test: 14073个样本,7194410字节
  • validation_unique: 500个样本,248229字节
  • test_unique: 500个样本,256313字节

数据集大小

  • 下载大小: 175013617字节
  • 数据集大小: 325382083字节
搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作