five

floschne/xflickrco

收藏
Hugging Face2024-05-24 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/floschne/xflickrco
下载链接
链接失效反馈
官方服务:
资源简介:
xFlickrCo数据集是一个多语言图像到文本数据集,包含德语(de)、英语(en)、西班牙语(es)、印度尼西亚语(id)、日语(ja)、俄语(ru)、土耳其语(tr)和中文(zh)的分割。每个语言分割包含2000个示例,数据集总大小约为724MB。数据集的特征包括句子、ID和图像,其中图像以二进制格式存储。该数据集适用于图像到文本的任务,并遵循CC-BY-4.0许可证。

xFlickrCo数据集是一个多语言图像到文本数据集,包含德语(de)、英语(en)、西班牙语(es)、印度尼西亚语(id)、日语(ja)、俄语(ru)、土耳其语(tr)和中文(zh)的分割。每个语言分割包含2000个示例,数据集总大小约为724MB。数据集的特征包括句子、ID和图像,其中图像以二进制格式存储。该数据集适用于图像到文本的任务,并遵循CC-BY-4.0许可证。
提供机构:
floschne
原始信息汇总

数据集概述

数据集特征

  • sentences:文本类型,数据类型为字符串。
  • id:标识符,数据类型为字符串。
  • image:图像信息,包含以下子特征:
    • bytes:图像数据,数据类型为二进制。
    • path:图像路径,数据类型为空(null)。

数据集分割

  • de:包含2000个示例,总字节数为90583477。
  • en:包含2000个示例,总字节数为90603317。
  • es:包含2000个示例,总字节数为90611504。
  • id:包含2000个示例,总字节数为90617412。
  • ja:包含2000个示例,总字节数为90651894。
  • ru:包含2000个示例,总字节数为90717990。
  • tr:包含2000个示例,总字节数为90598221。
  • zh:包含2000个示例,总字节数为90572352。

数据集大小

  • 下载大小:724435226字节。
  • 数据集大小:724956167字节。

许可信息

  • 许可证:CC-BY-4.0。

任务类别

  • image-to-text:图像到文本的任务。

支持的语言

  • de:德语。
  • en:英语。
  • es:西班牙语。
  • id:印尼语。
  • ja:日语。
  • ru:俄语。
  • tr:土耳其语。
  • zh:中文。

数据集名称

  • pretty_name:xFlickrCo。

数据集规模

  • size_categories:10K<n<100K,表示数据集规模在1万到10万之间。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作