five

khalidalt/xtd_11

收藏
Hugging Face2024-02-28 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/khalidalt/xtd_11
下载链接
链接失效反馈
官方服务:
资源简介:
扩展的XTD-11数据集,现在包括阿拉伯语,增强了原始的XTD集合。该数据集引入了1000张多语言的MSCOCO2014图像描述,用于测试11种语言中的零样本图像或文本检索。

扩展的XTD-11数据集,现在包括阿拉伯语,增强了原始的XTD集合。该数据集引入了1000张多语言的MSCOCO2014图像描述,用于测试11种语言中的零样本图像或文本检索。
提供机构:
khalidalt
原始信息汇总

数据集概述

数据集摘要

扩展的XTD-11数据集,现包括阿拉伯语,增强了原始的XTD集合。该数据集引入了一个包含1,000张图像的多语言MSCOCO2014标题,用于测试11种语言中的零样本图像或文本检索的多模态能力。

数据集详情

任务类别

  • 图像到文本
  • 文本到图像

语言

  • 阿拉伯语 (ar)
  • 英语 (en)
  • 俄语 (ru)
  • 意大利语 (it)
  • 西班牙语 (es)
  • 韩语 (ko)
  • 波兰语 (pl)
  • 土耳其语 (tr)
  • 中文 (zh)
  • 德语 (de)
  • 法语 (fr)
  • 日语 (ja)

数据集大小

  • 1K<n<10K

引用

@misc{aggarwal2020zeroshot, title={Towards Zero-shot Cross-lingual Image Retrieval}, author={Pranav Aggarwal and Ajinkya Kale}, year={2020}, eprint={2012.05107}, archivePrefix={arXiv}, primaryClass={cs.CL} }

对于阿拉伯语版本,可以引用此仓库:

@misc{XTD_11, title = XTD_11, author={Khalid Almubarak, Mohammed Alkhowaiter, Asem Alaskar}, howpublished = {url{https://huggingface.co/datasets/khalidalt/xtd_11}}, note = {Accessed: 2023-02-02} }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作