five

1aurent/unsplash-lite

收藏
Hugging Face2023-12-21 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/1aurent/unsplash-lite
下载链接
链接失效反馈
官方服务:
资源简介:
Unsplash Lite数据集(v1.2.1)是一个包含约25,000张照片的精简版数据集,与完整数据集具有相同的字段。该数据集适用于文本到图像和图像到文本的任务,并根据特定条款可用于商业和非商业用途。数据集中的每个特征,如照片、摄影师、EXIF、位置、统计、AI、关键词、收藏、转换和颜色,都具有特定的数据结构和类型。

Unsplash Lite数据集(v1.2.1)是一个包含约25,000张照片的精简版数据集,与完整数据集具有相同的字段。该数据集适用于文本到图像和图像到文本的任务,并根据特定条款可用于商业和非商业用途。数据集中的每个特征,如照片、摄影师、EXIF、位置、统计、AI、关键词、收藏、转换和颜色,都具有特定的数据结构和类型。
提供机构:
1aurent
原始信息汇总

数据集概述

数据集信息

特征

  • photo
    • id: string
    • url: string
    • image_url: string
    • submitted_at: string
    • featured: bool
    • width: uint16
    • height: uint16
    • aspect_ratio: float32
    • description: string
    • blur_hash: string
  • photographer
    • username: string
    • first_name: string
    • last_name: string
  • exif
    • camera_make: string
    • camera_model: string
    • iso: string
    • aperture_value: string
    • focal_length: string
    • exposure_time: string
  • location
    • name: string
    • latitude: float32
    • longitude: float32
    • country: string
    • city: string
  • stats
    • views: uint32
    • downloads: uint32
  • ai
    • description: string
    • primary_landmark_name: string
    • primary_landmark_latitude: string
    • primary_landmark_longitude: string
    • primary_landmark_confidence: string
  • keywords
    • keyword: string
    • ai_service_1_confidence: string
    • ai_service_2_confidence: string
    • suggested_by_user: bool
  • collections
    • collection_id: string
    • collection_title: string
    • photo_collected_at: string
  • conversions
    • converted_at: string
    • conversion_type: string
    • keyword: string
    • anonymous_user_id: string
    • conversion_country: string
  • colors
    • hex: string
    • red: uint8
    • green: uint8
    • blue: uint8
    • keyword: string
    • ai_coverage: float32
    • ai_score: float32

数据分割

  • train
    • 字节数: 1202216966
    • 样本数: 25000

数据集大小

  • 下载大小: 618337921
  • 数据集大小: 1202216966

配置

  • default
    • 数据文件:
      • 分割: train
      • 路径: data/train-*

许可证

  • 类型: other
  • 名称: unsplash-commercial
  • 链接: https://github.com/unsplash/datasets/blob/master/DOCS.md

任务类别

  • text-to-image
  • image-to-text

语言

  • en

标签

  • unsplash
  • v1.2.1

名称

  • Unsplash Lite

大小类别

  • 10K<n<100K
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作