dinhanhx/TextCaps-vi
收藏Hugging Face2023-06-17 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/dinhanhx/TextCaps-vi
下载链接
链接失效反馈官方服务:
资源简介:
这是TextCaps数据集的越南语版本,包含109765个用于训练的图片-描述对和15830个用于验证的图片-描述对。该版本使用Google Translate API构建,并保留了与英文版本几乎相同的元数据。越南语版本缺少以下键值:`caption_tokens`、`reference_tokens`、`reference_strs`和`image_classes`。作者提供了英文和越南语的.json文件。
这是TextCaps数据集的越南语版本,包含109765个用于训练的图片-描述对和15830个用于验证的图片-描述对。该版本使用Google Translate API构建,并保留了与英文版本几乎相同的元数据。越南语版本缺少以下键值:`caption_tokens`、`reference_tokens`、`reference_strs`和`image_classes`。作者提供了英文和越南语的.json文件。
提供机构:
dinhanhx
原始信息汇总
数据集概述
数据集名称
- 名称: TextCaps in Vietnamese
语言
- 支持语言: 越南语(vi)、英语(en)
来源数据集
- 来源: TextCaps, OpenImages
标签
- 标签: TextCaps, TextCaps-vi
许可
- 许可状态: 未知
任务类别
- 任务类别: 图像到文本
任务ID
- 任务ID: 图像标题生成
数据集内容
- 内容描述: 包含109,765个训练用的图像-标题对和15,830个验证用的图像-标题对。
- 构建方式: 使用Google Translate API将英文版本转换为越南语版本。
- 数据点差异: 越南语版本不包含以下键:
caption_tokens,reference_tokens,reference_strs,image_classes。 - 文件格式: 提供英语和越南语的.json文件。



