SEACrowd/uit_viic
收藏Hugging Face2024-06-24 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/SEACrowd/uit_viic
下载链接
链接失效反馈官方服务:
资源简介:
UIT-ViIC数据集包含来自Microsoft COCO数据集的与球类运动相关的图像的手写越南语描述。该数据集由3,850张图像和19,250个越南语描述组成,每张图像有五个由不同注释者提供的描述。数据集的主要任务是图像描述(Image Captioning)。
UIT-ViIC数据集包含来自Microsoft COCO数据集的与球类运动相关的图像的手写越南语描述。该数据集由3,850张图像和19,250个越南语描述组成,每张图像有五个由不同注释者提供的描述。数据集的主要任务是图像描述(Image Captioning)。
提供机构:
SEACrowd
原始信息汇总
UIT-ViIC 数据集概述
基本信息
- 数据集名称: UIT-ViIC
- 语言: 越南语 (vi)
- 任务类别: 图像描述生成 (image-captioning)
- 标签: 图像描述生成 (image-captioning)
数据集描述
- 内容: UIT-ViIC 包含为 Microsoft COCO 数据集中与球类运动相关的图像手动编写的越南语描述。
- 规模: 包含 19,250 条越南语描述,对应 3,850 张图像。每张图像提供 5 条由 5 位标注者编写的越南语描述。
数据集版本
- 源版本: 1.0.0
- SEACrowd 版本: 2024.06.20
数据集许可证
- 许可证: 未知 (unknown)
引用信息
-
引用方式:
@InProceedings{10.1007/978-3-030-63007-2_57, author="Lam, Quan Hoang and Le, Quang Duy and Nguyen, Van Kiet and Nguyen, Ngan Luu-Thuy", title="UIT-ViIC: A Dataset for the First Evaluation on Vietnamese Image Captioning", year="2020", pages="730--742" }
@article{lovenia2024seacrowd, title={SEACrowd: A Multilingual Multimodal Data Hub and Benchmark Suite for Southeast Asian Languages}, year={2024}, eprint={2406.10118}, journal={arXiv preprint arXiv: 2406.10118} }



