floschne/xflickrco
收藏Hugging Face2024-05-24 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/floschne/xflickrco
下载链接
链接失效反馈官方服务:
资源简介:
xFlickrCo数据集是一个多语言图像到文本数据集,包含德语(de)、英语(en)、西班牙语(es)、印度尼西亚语(id)、日语(ja)、俄语(ru)、土耳其语(tr)和中文(zh)的分割。每个语言分割包含2000个示例,数据集总大小约为724MB。数据集的特征包括句子、ID和图像,其中图像以二进制格式存储。该数据集适用于图像到文本的任务,并遵循CC-BY-4.0许可证。
xFlickrCo数据集是一个多语言图像到文本数据集,包含德语(de)、英语(en)、西班牙语(es)、印度尼西亚语(id)、日语(ja)、俄语(ru)、土耳其语(tr)和中文(zh)的分割。每个语言分割包含2000个示例,数据集总大小约为724MB。数据集的特征包括句子、ID和图像,其中图像以二进制格式存储。该数据集适用于图像到文本的任务,并遵循CC-BY-4.0许可证。
提供机构:
floschne
原始信息汇总
数据集概述
数据集特征
- sentences:文本类型,数据类型为字符串。
- id:标识符,数据类型为字符串。
- image:图像信息,包含以下子特征:
- bytes:图像数据,数据类型为二进制。
- path:图像路径,数据类型为空(null)。
数据集分割
- de:包含2000个示例,总字节数为90583477。
- en:包含2000个示例,总字节数为90603317。
- es:包含2000个示例,总字节数为90611504。
- id:包含2000个示例,总字节数为90617412。
- ja:包含2000个示例,总字节数为90651894。
- ru:包含2000个示例,总字节数为90717990。
- tr:包含2000个示例,总字节数为90598221。
- zh:包含2000个示例,总字节数为90572352。
数据集大小
- 下载大小:724435226字节。
- 数据集大小:724956167字节。
许可信息
- 许可证:CC-BY-4.0。
任务类别
- image-to-text:图像到文本的任务。
支持的语言
- de:德语。
- en:英语。
- es:西班牙语。
- id:印尼语。
- ja:日语。
- ru:俄语。
- tr:土耳其语。
- zh:中文。
数据集名称
- pretty_name:xFlickrCo。
数据集规模
- size_categories:10K<n<100K,表示数据集规模在1万到10万之间。



