five

dinhanhx/TextCaps-vi

收藏
Hugging Face2023-06-17 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/dinhanhx/TextCaps-vi
下载链接
链接失效反馈
官方服务:
资源简介:
这是TextCaps数据集的越南语版本,包含109765个用于训练的图片-描述对和15830个用于验证的图片-描述对。该版本使用Google Translate API构建,并保留了与英文版本几乎相同的元数据。越南语版本缺少以下键值:`caption_tokens`、`reference_tokens`、`reference_strs`和`image_classes`。作者提供了英文和越南语的.json文件。

这是TextCaps数据集的越南语版本,包含109765个用于训练的图片-描述对和15830个用于验证的图片-描述对。该版本使用Google Translate API构建,并保留了与英文版本几乎相同的元数据。越南语版本缺少以下键值:`caption_tokens`、`reference_tokens`、`reference_strs`和`image_classes`。作者提供了英文和越南语的.json文件。
提供机构:
dinhanhx
原始信息汇总

数据集概述

数据集名称

  • 名称: TextCaps in Vietnamese

语言

  • 支持语言: 越南语(vi)、英语(en)

来源数据集

  • 来源: TextCaps, OpenImages

标签

  • 标签: TextCaps, TextCaps-vi

许可

  • 许可状态: 未知

任务类别

  • 任务类别: 图像到文本

任务ID

  • 任务ID: 图像标题生成

数据集内容

  • 内容描述: 包含109,765个训练用的图像-标题对和15,830个验证用的图像-标题对。
  • 构建方式: 使用Google Translate API将英文版本转换为越南语版本。
  • 数据点差异: 越南语版本不包含以下键:caption_tokens, reference_tokens, reference_strs, image_classes
  • 文件格式: 提供英语和越南语的.json文件。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作