dinhanhx/TextVQA-vi
收藏Hugging Face2023-09-21 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/dinhanhx/TextVQA-vi
下载链接
链接失效反馈官方服务:
资源简介:
这是TextVQA数据集的越南语版本,通过Google翻译从英文版TextVQA转换而来。构建越南语版本的过程包括下载原始英文数据文件,生成唯一文本的txt文件,并将这些文件翻译成越南语生成对应的jsonl文件。加载越南语版本数据时需要使用原始英文版本,并通过英文文本作为键从jsonl文件中检索越南语值。
提供机构:
dinhanhx
原始信息汇总
数据集概述
数据集名称
- 名称: TextVQA in Vietnamese
语言
- 支持语言:
- 越南语 (vi)
- 英语 (en)
来源数据集
- 来源:
- TextVQA
- OpenImages
标签
- 标签:
- TextVQA
- TextVQA-vi
许可证
- 许可证: 未知
任务类别
- 任务类别: 视觉问答 (visual-question-answering)
任务ID
- 任务ID: 视觉问答 (visual-question-answering)
数据结构
-
英语版本:
- 包含
TextVQA_0.5.1_train.json,TextVQA_0.5.1_val.json - 生成 txt 文件:
train_answer_list.txt,train_question_list.txt,val_answer_list.txt,val_question_list.txt
- 包含
-
越南语版本:
- 通过翻译英语 txt 文件生成:
train_answer_list.jsonl,train_question_list.jsonl,val_answer_list.jsonl,val_question_list.jsonl - 每个文件的条目中,键为原始英语文本,值为越南语翻译文本
- 通过翻译英语 txt 文件生成:
使用指南
- 加载指南:
- 需要原始英语版本
- 使用英语文本作为键,从 jsonl 文件中检索越南语值



