five

AterMors/wikiart_recaption

收藏
Hugging Face2024-07-11 更新2024-07-13 收录
下载链接:
https://hf-mirror.com/datasets/AterMors/wikiart_recaption
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含图像、文本和索引三个特征,主要用于图像到文本的任务。数据集仅包含训练集,共有81355个示例,总大小为51733249508.27字节。数据集的许可证为Apache-2.0,语言为英语,规模类别为10K到100K之间。数据集是使用vikhyatk/moondream2模型对WikiArt数据集进行标注的,提示为生成简短、简单且仅视觉描述的图像标题。

This dataset contains three features: image, text, and index, primarily used for image-to-text tasks. The dataset includes only a training set with 81,355 examples and a total size of 51,733,249,508.27 bytes. The dataset is licensed under Apache-2.0, in English, and falls into the size category of 10K to 100K. The dataset is captioned using the vikhyatk/moondream2 model on the WikiArt dataset with the prompt to generate a short, simple, and only visually descriptive caption for the image.
提供机构:
AterMors
原始信息汇总

数据集概述

数据集信息

  • 特征:
    • image: 图像数据
    • text: 字符串序列
    • index: 整数类型
  • 分割:
    • train: 训练集
      • 字节数: 51733249508.27
      • 样本数: 81355
  • 下载大小: 51732268420
  • 数据集大小: 51733249508.27

配置

  • 配置名称: default
    • 数据文件:
      • train: data/train-*

许可

  • 许可证: Apache 2.0

任务类别

  • 任务类别: 图像到文本

语言

  • 语言: 英语

数据集大小类别

  • 大小类别: 10K < n < 100K
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作