dinhanhx/OK-VQA-multilang
收藏Hugging Face2023-09-21 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/dinhanhx/OK-VQA-multilang
下载链接
链接失效反馈官方服务:
资源简介:
这是一个名为OK-VQA in multilang的数据集,它是OK-VQA数据集的多语言翻译版本,特别是越南语版本。数据集构建过程包括从OK-VQA获取原始英文数据,生成唯一的文本文件,然后将其翻译成越南语并存储在jsonl文件中。数据集支持视觉问答任务,目前包含英语和越南语两种语言。
这是一个名为OK-VQA in multilang的数据集,它是OK-VQA数据集的多语言翻译版本,特别是越南语版本。数据集构建过程包括从OK-VQA获取原始英文数据,生成唯一的文本文件,然后将其翻译成越南语并存储在jsonl文件中。数据集支持视觉问答任务,目前包含英语和越南语两种语言。
提供机构:
dinhanhx
原始信息汇总
数据集概述
数据集名称
- 名称: OK-VQA in multilang
语言支持
- 支持的语言:
- 越南语 (vi)
- 英语 (en)
数据来源
- 源数据集:
- OK-VQA
- COCO
标签
- 标签:
- OK-VQA
- OK-VQA-vi
许可
- 许可状态: 未知
任务类别
- 任务类别: 视觉问答
- 任务ID: 视觉问答
数据结构
- 英语版本: 包含多个JSON文件,如
mscoco_train2014_annotations.json,mscoco_val2014_annotations.json,OpenEnded_mscoco_train2014_questions.json,OpenEnded_mscoco_val2014_questions.json。 - 越南语版本: 通过翻译英语版本的文本文件生成,包括
train_answer_list.jsonl,train_question_list.jsonl,val_answer_list.jsonl,val_question_list.jsonl。
使用指南
- 使用越南语版本: 需要原始英语版本作为键,从JSONL文件中检索对应的越南语值。
当前支持的语言
- 当前语言:
- 英语
- 越南语
翻译应用
- 翻译脚本: 参考此代码进行翻译应用。



