Viet-Doc-VQA-II
收藏魔搭社区2025-12-04 更新2025-01-11 收录
下载链接:
https://modelscope.cn/datasets/5CD-AI/Viet-Doc-VQA-II
下载链接
链接失效反馈官方服务:
资源简介:
# Dataset Overview
This dataset is a continuation of the ongoing work from **[Viet Document VAQ dataset](https://huggingface.co/datasets/5CD-AI/Viet-Doc-VQA)** was collected from **64,765** pages of Vietnamese 🇻🇳 textbooks( Sách bài tập, chuyên đề, sách giáo án của Bộ GDĐT, Cánh Diều, Chân trời sáng tạo, Kết nối tri thức), spanning all subjects from grades 1 to 12. Each page has been analyzed and annotated using advanced Visual Question Answering (VQA) techniques to produce a comprehensive dataset.
There is a set of **388,277** detailed descriptions and query-based questions and answers generated by the Gemini 1.5 Flash model, currently Google's leading model on the [WildVision Arena Leaderboard](https://huggingface.co/spaces/WildVision/vision-arena). This results in a richly annotated dataset, ideal for various educational and research applications.
Please give us a like ❤️ if you find it useful !
**Subjects included:**
Toán học 📐, Ngữ văn 📚, Tiếng Anh 🇬🇧, Vật lý ⚛️, Hóa học 🧪, Sinh học 🌱, Lịch sử 📜, Địa lý 🌍, Giáo dục công dân 🏫, Tin học 💻, Công nghệ 🛠️, Âm nhạc 🎵, Mỹ thuật 🎨, Thể dục ⚽, ....
<div align="center">
<img src="https://i.pinimg.com/474x/7e/fa/88/7efa88c5eb6e61e7fe221d0a9d5febda.jpg" width="500"/>
</div>
Description
```
Bức ảnh là một trang sách giáo khoa lịch sử với nội dung giới thiệu về Đại tướng Võ Nguyên Giáp. Bức ảnh được chia thành hai phần chính:
* **Phần bên trái:** Bao gồm phần văn bản giới thiệu về Đại tướng Võ Nguyên Giáp, với các tiêu đề:
* "4. Võ Nguyên Giáp (1911 – 2013)"
* "Vị tướng tài năng"
* "Nhà tư tưởng, nhà quân sự lớn"
Nội dung phần văn bản này tập trung vào việc mô tả cuộc đời, sự nghiệp và những đóng góp của Đại tướng Võ Nguyên Giáp trong cuộc kháng chiến chống Pháp và chống Mỹ.
* **Phần bên phải:** Là hình ảnh chân dung của Đại tướng Võ Nguyên Giáp, được chụp vào năm 1957. Hình ảnh được đặt trong một khung hình nhỏ, có ghi chú "Hình 8. Đại tướng Võ Nguyên Giáp (ảnh chụp năm 1957)".
Ngoài ra, bức ảnh còn có một số chi tiết nhỏ như:
* Biểu tượng dấu hỏi màu xanh ở góc trên bên trái, gợi ý người đọc có thể tìm hiểu thêm về chủ đề này.
* Biểu tượng hình mũi tên màu xanh ở góc dưới bên phải, gợi ý người đọc có thể tiếp tục đọc phần nội dung tiếp theo.
* Số trang "54" ở góc dưới bên trái.
* Dòng chữ "Đọc bản mới nhất trên hoc10.vn" ở góc dưới bên trái.
* Dòng chữ "Bản mẫu" ở góc dưới bên phải.
```
QnA
```
[{'role': 'user', 'content': 'Đại tướng Võ Nguyên Giáp sinh năm nào và mất năm nào?'},
{'role': 'assistant', 'content': 'Đại tướng Võ Nguyên Giáp sinh năm 1911 và mất năm 2013.'},
{'role': 'user', 'content': 'Đại tướng Võ Nguyên Giáp thành lập đơn vị quân đội nào vào ngày 22-12-1944?'},
{'role': 'assistant', 'content': 'Ngày 22-12-1944, Đại tướng Võ Nguyên Giáp thành lập Đội Việt Nam Tuyên truyền Giải phóng quân với 34 chiến sĩ đầu tiên.'},
{'role': 'user', 'content': 'Đại tướng Võ Nguyên Giáp đã có những đóng góp quan trọng nào trong cuộc kháng chiến chống Pháp và chống Mỹ?'},
{'role': 'assistant', 'content': 'Đại tướng Võ Nguyên Giáp đã có những đóng góp quan trọng trong cuộc kháng chiến chống Pháp (1945 - 1954) và kháng chiến chống Mỹ (1954 - 1975), đặc biệt là trong việc chỉ huy nhiều chiến dịch lớn, điển hình là chiến dịch Điện Biên Phủ (1954) và chiến dịch Hồ Chí Minh (1975).'},
{'role': 'user', 'content': 'Theo văn bản, đâu là quyết định khó khăn nhất của Đại tướng Võ Nguyên Giáp trong cuộc đời chỉ huy của mình?'},
{'role': 'assistant', 'content': 'Theo văn bản, quyết định khó khăn nhất của Đại tướng Võ Nguyên Giáp trong cuộc đời chỉ huy là thay đổi phương châm tác chiến, từ "Đánh nhanh, thắng nhanh" sang "Đánh chắc, tiến chắc". Quyết định này góp phần quan trọng làm nên thắng lợi của chiến dịch Điện Biên Phủ 1954.'},
{'role': 'user', 'content': 'Theo văn bản, đâu là tư tưởng xuyên suốt của Đại tướng Võ Nguyên Giáp?'},
{'role': 'assistant', 'content': 'Theo văn bản, tư tưởng xuyên suốt của Đại tướng Võ Nguyên Giáp là chiến tranh nhân dân, chú trọng nghệ thuật lấy ít địch nhiều, lấy yếu thắng mạnh.'}]
```
<div style="display: grid; grid-template-columns: repeat(7, 100px); grid-gap: 10px;">
<img src="https://i.pinimg.com/474x/bb/e9/14/bbe914cfc08a768a9c9db3df92cbed82.jpg" style="width: 100px;">
<img src="https://i.pinimg.com/474x/27/33/69/273369e4dad5713146c9bf6f31ed7cfe.jpg" style="width: 100px;">
<img src="https://i.pinimg.com/474x/3c/5f/ff/3c5fffba840aabeb75a5172973401e72.jpg" style="width: 100px;">
<img src="https://i.pinimg.com/474x/fe/f4/ec/fef4ec20e2864dd3f418d69c0c4ea58d.jpg" style="width: 100px;">
<img src="https://i.pinimg.com/474x/79/d3/10/79d310c8a4ac68d3e796a0fe5e472a34.jpg" style="width: 100px;">
<img src="https://i.pinimg.com/474x/3b/80/c4/3b80c45db82726f67fa5bd9589f10fbe.jpg" style="width: 100px;">
<img src="https://i.pinimg.com/474x/fb/9f/46/fb9f46765fec20347ba2edf0a7d51556.jpg" style="width: 100px;">
</div>
# Cite
```
@misc{doan2024vintern1befficientmultimodallarge,
title={Vintern-1B: An Efficient Multimodal Large Language Model for Vietnamese},
author={Khang T. Doan and Bao G. Huynh and Dung T. Hoang and Thuc D. Pham and Nhat H. Pham and Quan T. M. Nguyen and Bang Q. Vo and Suong N. Hoang},
year={2024},
eprint={2408.12480},
archivePrefix={arXiv},
primaryClass={cs.LG},
url={https://arxiv.org/abs/2408.12480},
}
```
# 数据集概览
本数据集是**[越南文档VAQ(Viet Document VAQ)数据集](https://huggingface.co/datasets/5CD-AI/Viet-Doc-VQA)**后续研究工作的成果,其数据源自64765页越南课本,涵盖越南教育培训部的练习册、专题资料、教案,以及"方舟"(Cánh Diều)、"创新天地"(Chân trời sáng tạo)、"知识连接"(Kết nối tri thức)系列教辅,覆盖1至12年级的全学科内容。研究团队采用先进的视觉问答(Visual Question Answering, VQA)技术对每一页文本与图像进行分析与标注,最终构建得到该全面数据集。
本数据集包含由Gemini 1.5 Flash模型生成的388277条详细描述、基于查询的问答对,而Gemini 1.5 Flash是目前谷歌在WildVision竞技场排行榜(WildVision Arena Leaderboard,https://huggingface.co/spaces/WildVision/vision-arena)上的领先模型。丰富的标注信息使得本数据集可广泛适用于各类教育与研究场景。
若您觉得本数据集有所助益,请为我们点赞 ❤️!
## 涵盖学科
数学 📐、语文 📚、英语 🇬🇧、物理 ⚛️、化学 🧪、生物 🌱、历史 📜、地理 🌍、公民教育 🏫、信息技术 💻、通用技术 🛠️、音乐 🎵、美术 🎨、体育 ⚽ 等……
<div align="center">
<img src="https://i.pinimg.com/474x/7e/fa/88/7efa88c5eb6e61e7fe221d0a9d5febda.jpg" width="500"/>
</div>
## 示例描述
本示例图片为历史教科书页面,内容围绕越南大将武元甲展开介绍。该页面主要分为两个部分:
* **左侧区域:** 包含介绍武元甲大将的文本内容,标题如下:
* "4. 武元甲大将(1911年—2013年)"
* "杰出军事家"
* "伟大的思想家、军事家"
该文本部分主要介绍武元甲大将的生平、事业及其在抗法、抗美战争中作出的贡献。
* **右侧区域:** 为武元甲大将的肖像照片,拍摄于1957年。该照片置于小型相框中,并配有标注"图8. 武元甲大将(1957年摄)"。
此外,该页面还包含以下细节元素:
* 左上角设有蓝色问号图标,提示读者可进一步了解该主题;
* 右下角设有蓝色箭头图标,提示读者可继续阅读后续内容;
* 左下角标注页码"54";
* 左下角配有文字"在hoc10.vn阅读最新版本";
* 右下角标注"样稿"字样。
## 问答对
[{'角色': '用户', '内容': '武元甲大将生于哪一年,卒于哪一年?'},
{'角色': '助手', '内容': '武元甲大将生于1911年,卒于2013年。'},
{'角色': '用户', '内容': '1944年12月22日,武元甲大将组建了哪支军队单位?'},
{'角色': '助手', '内容': '1944年12月22日,武元甲大将组建了越南解放军宣传队,首批成员共34名战士。'},
{'角色': '用户', '内容': '武元甲大将在抗法、抗美战争中作出了哪些重要贡献?'},
{'角色': '助手', '内容': '武元甲大将在抗法战争(1945年—1954年)与抗美战争(1954年—1975年)中作出了重要贡献,尤其指挥了多场经典大型战役,例如1954年的奠边府战役与1975年的胡志明战役。'},
{'角色': '用户', '内容': '根据文本内容,武元甲大将在指挥生涯中作出的最艰难决策是什么?'},
{'角色': '助手', '内容': '根据文本内容,武元甲大将在指挥生涯中作出的最艰难决策是将作战方针从"速战速决"调整为"稳打稳进"。该决策为1954年奠边府战役的胜利奠定了重要基础。'},
{'角色': '用户', '内容': '根据文本内容,武元甲大将贯穿始终的军事思想是什么?'},
{'角色': '助手', '内容': '根据文本内容,武元甲大将贯穿始终的军事思想是人民战争思想,即注重以少胜多、以弱胜强的作战艺术。'}]
<div style="display: grid; grid-template-columns: repeat(7, 100px); grid-gap: 10px;">
<img src="https://i.pinimg.com/474x/bb/e9/14/bbe914cfc08a768a9c9db3df92cbed82.jpg" style="width: 100px;">
<img src="https://i.pinimg.com/474x/27/33/69/273369e4dad5713146c9bf6f31ed7cfe.jpg" style="width: 100px;">
<img src="https://i.pinimg.com/474x/3c/5f/ff/3c5fffba840aabeb75a5172973401e72.jpg" style="width: 100px;">
<img src="https://i.pinimg.com/474x/fe/f4/ec/fef4ec20e2864dd3f418d69c0c4ea58d.jpg" style="width: 100px;">
<img src="https://i.pinimg.com/474x/79/d3/10/79d310c8a4ac68d3e796a0fe5e472a34.jpg" style="width: 100px;">
<img src="https://i.pinimg.com/474x/3b/80/c4/3b80c45db82726f67fa5bd9589f10fbe.jpg" style="width: 100px;">
<img src="https://i.pinimg.com/474x/fb/9f/46/fb9f46765fec20347ba2edf0a7d51556.jpg" style="width: 100px;">
</div>
## 引用
@misc{doan2024vintern1befficientmultimodallarge,
title={Vintern-1B: An Efficient Multimodal Large Language Model for Vietnamese},
author={Khang T. Doan and Bao G. Huynh and Dung T. Hoang and Thuc D. Pham and Nhat H. Pham and Quan T. M. Nguyen and Bang Q. Vo and Suong N. Hoang},
year={2024},
eprint={2408.12480},
archivePrefix={arXiv},
primaryClass={cs.LG},
url={https://arxiv.org/abs/2408.12480},
}
提供机构:
maas
创建时间:
2025-01-08



