five

dinhanhx/OK-VQA-multilang

收藏
Hugging Face2023-09-21 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/dinhanhx/OK-VQA-multilang
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个名为OK-VQA in multilang的数据集,它是OK-VQA数据集的多语言翻译版本,特别是越南语版本。数据集构建过程包括从OK-VQA获取原始英文数据,生成唯一的文本文件,然后将其翻译成越南语并存储在jsonl文件中。数据集支持视觉问答任务,目前包含英语和越南语两种语言。

这是一个名为OK-VQA in multilang的数据集,它是OK-VQA数据集的多语言翻译版本,特别是越南语版本。数据集构建过程包括从OK-VQA获取原始英文数据,生成唯一的文本文件,然后将其翻译成越南语并存储在jsonl文件中。数据集支持视觉问答任务,目前包含英语和越南语两种语言。
提供机构:
dinhanhx
原始信息汇总

数据集概述

数据集名称

  • 名称: OK-VQA in multilang

语言支持

  • 支持的语言:
    • 越南语 (vi)
    • 英语 (en)

数据来源

  • 源数据集:
    • OK-VQA
    • COCO

标签

  • 标签:
    • OK-VQA
    • OK-VQA-vi

许可

  • 许可状态: 未知

任务类别

  • 任务类别: 视觉问答
  • 任务ID: 视觉问答

数据结构

  • 英语版本: 包含多个JSON文件,如mscoco_train2014_annotations.json, mscoco_val2014_annotations.json, OpenEnded_mscoco_train2014_questions.json, OpenEnded_mscoco_val2014_questions.json
  • 越南语版本: 通过翻译英语版本的文本文件生成,包括train_answer_list.jsonl, train_question_list.jsonl, val_answer_list.jsonl, val_question_list.jsonl

使用指南

  • 使用越南语版本: 需要原始英语版本作为键,从JSONL文件中检索对应的越南语值。

当前支持的语言

  • 当前语言:
    • 英语
    • 越南语

翻译应用

  • 翻译脚本: 参考此代码进行翻译应用。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作