Viet-ComputerScience-VQA
收藏魔搭社区2025-12-04 更新2025-01-11 收录
下载链接:
https://modelscope.cn/datasets/5CD-AI/Viet-ComputerScience-VQA
下载链接
链接失效反馈官方服务:
资源简介:
# Dataset Overview
This dataset is was created from **6899** Vietnamese 🇻🇳 Computer Science books. Each image has been analyzed and annotated using advanced Visual Question Answering (VQA) techniques to produce a comprehensive dataset.
There is a set of **40,000** detailed descriptions, and query-based questions and answers generated by the Gemini 1.5 Flash model, currently Google's leading model on the [WildVision Arena Leaderboard](https://huggingface.co/spaces/WildVision/vision-arena). This results in a richly annotated dataset, ideal for various educational and research applications.
Please give us a like ❤️ if you find it useful !
<div align="center">
<img src="https://i.pinimg.com/474x/31/68/14/316814ea10162553e0ef936bcb6fb5ec.jpg" width="400"/>
</div>
Description
```
Bức ảnh mô tả thuật toán Dijkstra tìm đường đi ngắn nhất trong đồ thị. Phần trên của ảnh là phần code thuật toán, với các bước thực hiện:
- Khởi tạo tập hợp đỉnh chưa thăm S và hàng đợi ưu tiên Q, Q bao gồm tất cả các đỉnh trong đồ thị.
- Lặp cho đến khi Q rỗng: - Lấy đỉnh u có trọng số d[u] nhỏ nhất khỏi Q - Thêm đỉnh u vào tập hợp S.
- Cập nhật trọng số d[v] của các đỉnh v kề với u nếu d[u] + trọng số cạnh (u,v) nhỏ hơn d[v].
Phần dưới của ảnh là hình minh họa cho từng bước thuật toán. Hình minh họa cho thấy đồ thị với các cạnh có trọng số,
các đỉnh được tô màu đen hoặc trắng. Đỉnh đen là những đỉnh đã được thêm vào tập S. - Hình (a) thể hiện đồ thị ban đầu.
- Các hình (b) đến (f) thể hiện quá trình thuật toán Dijkstra hoạt động. - Mỗi hình minh họa cho thấy các đỉnh được cập nhật, đỉnh có màu đen là đỉnh đã được thêm vào tập hợp S.
- Trọng số d[v] được hiển thị bên cạnh mỗi đỉnh. Phần giải thích ở dưới cùng giải thích chi tiết cách thuật toán hoạt động.
```
QnA
```
[
{ "role": "user", "content": "Thuật toán Dijkstra giải quyết bài toán gì?" },
{ "role": "assistant", "content": "Thuật toán Dijkstra giải quyết bài toán tìm đường đi ngắn nhất từ một đỉnh nguồn đến các đỉnh khác trong đồ thị có trọng số. Thuật toán sử dụng phương pháp tham lam để tìm kiếm các cạnh có trọng số nhỏ nhất để tạo thành đường đi ngắn nhất." },
{ "role": "user", "content": "Trong hình minh họa, đỉnh nào là đỉnh nguồn?" },
{ "role": "assistant", "content": "Trong hình minh họa, đỉnh nguồn là đỉnh s, được tô màu đen ở hình (a)." },
{ "role": "user", "content": "Tại sao các đỉnh được tô màu đen trong các hình (b) đến (f)?" },
{ "role": "assistant", "content": "Các đỉnh được tô màu đen trong các hình (b) đến (f) là các đỉnh đã được thêm vào tập hợp S, tức là các đỉnh đã được thuật toán Dijkstra tìm đường đi ngắn nhất từ đỉnh nguồn đến. Các đỉnh này đã được xử lý và trọng số d[v] của chúng đã được cập nhật." },
{ "role": "user", "content": "Thuật toán Dijkstra hoạt động dựa trên nguyên tắc nào?" },
{ "role": "assistant", "content": "Thuật toán Dijkstra hoạt động dựa trên nguyên tắc tham lam. Nó sẽ luôn chọn cạnh có trọng số nhỏ nhất để di chuyển từ đỉnh hiện tại đến đỉnh kế tiếp. Do đó, thuật toán này sẽ đảm bảo rằng đường đi ngắn nhất được tìm thấy." },
{ "role": "user", "content": "Hãy giải thích cách thuật toán Dijkstra hoạt động dựa trên hình minh họa." },
{ "role": "assistant", "content": "Thuật toán Dijkstra hoạt động như sau:\n\n1. Khởi tạo tập hợp S bao gồm đỉnh nguồn s (đỉnh s được tô màu đen trong hình (a)). Hàng đợi ưu tiên Q bao gồm tất cả các đỉnh trong đồ thị. Trọng số d[v] của đỉnh nguồn s được gán là 0, trọng số của các đỉnh còn lại được gán là vô cùng.\n\n2. Lặp cho đến khi Q rỗng: \n\t- Lấy đỉnh u có trọng số d[u] nhỏ nhất khỏi Q (đỉnh u được tô màu đen trong hình (b), (c), (d), (e), (f)).\n\t- Thêm đỉnh u vào tập hợp S.\n\t- Cập nhật trọng số d[v] của các đỉnh v kề với u nếu d[u] + trọng số cạnh (u,v) nhỏ hơn d[v] (ví dụ, trong hình (b), trọng số d[u] của đỉnh u là 10, trọng số cạnh (u,v) là 1, d[v] của đỉnh v là vô cùng. Vì 10 + 1 < vô cùng, nên d[v] của đỉnh v được cập nhật thành 11). \n\n3. Tiếp tục lặp lại các bước 2 cho đến khi Q rỗng. Khi đó, ta đã tìm được đường đi ngắn nhất từ đỉnh nguồn đến tất cả các đỉnh trong đồ thị." }
]
```
<div style="display: grid; grid-template-columns: repeat(8, 150px); grid-gap: 10px;">
<img src="https://i.pinimg.com/474x/14/8c/d9/148cd95fe15cd816ed40639c778f59b5.jpg" style="width: 150px;">
<img src="https://i.pinimg.com/474x/87/97/46/87974618c7c55636b3e44f19c37119d6.jpg" style="width: 150px;">
<img src="https://i.pinimg.com/474x/36/e5/eb/36e5eb991cc1d88ffa8df54c2a3145e7.jpg" style="width: 150px;">
<img src="https://i.pinimg.com/474x/93/46/a6/9346a68ecb3c6f974b4a17a4567bda0b.jpg" style="width: 150px;">
<img src="https://i.pinimg.com/474x/3b/51/c8/3b51c85507e38d69710b99917e0b9927.jpg" style="width: 150px;">
</div>
# Cite
```
@misc{doan2024vintern1befficientmultimodallarge,
title={Vintern-1B: An Efficient Multimodal Large Language Model for Vietnamese},
author={Khang T. Doan and Bao G. Huynh and Dung T. Hoang and Thuc D. Pham and Nhat H. Pham and Quan T. M. Nguyen and Bang Q. Vo and Suong N. Hoang},
year={2024},
eprint={2408.12480},
archivePrefix={arXiv},
primaryClass={cs.LG},
url={https://arxiv.org/abs/2408.12480},
}
```
# 数据集概览
本数据集源自**6899**本越南语🇻🇳计算机科学书籍。所有图像均通过先进的视觉问答(Visual Question Answering,VQA)技术进行分析与标注,最终构建得到该综合数据集。
数据集包含**40000**条详细描述,以及由Gemini 1.5 Flash模型生成的基于查询的问答对;该模型目前是谷歌在[WildVision竞技场排行榜](https://huggingface.co/spaces/WildVision/vision-arena)上的旗舰模型。由此形成的标注丰富的数据集,可广泛适配各类教育与科研应用场景。
若本数据集对您有所帮助,恳请点赞支持❤️!
<div align="center">
<img src="https://i.pinimg.com/474x/31/68/14/316814ea10162553e0ef936bcb6fb5ec.jpg" width="400"/>
</div>
## 描述
本图片展示用于求解图中最短路径的迪杰斯特拉(Dijkstra)算法。图片上方为该算法的代码段,包含如下执行步骤:
1. 初始化未访问顶点集合S与优先队列Q,Q包含图中所有顶点。
2. 循环直至Q为空:
- 从Q中取出当前权重`d[u]`最小的顶点u
- 将顶点u添加至集合S
3. 若`d[u] + 边(u,v)`的权重小于顶点v的当前权重`d[v]`,则更新与u相邻的顶点v的权重`d[v]`。
图片下方为算法各执行步骤的演示示意图。该演示图展示了带权边的图结构,顶点以黑色或白色标注:黑色顶点即为已被加入集合S的顶点。
- 图(a)展示初始状态下的图结构。
- 图(b)至图(f)展示迪杰斯特拉算法的完整运行过程。
- 每一张演示图均标注了已更新的顶点,其中黑色顶点代表已加入集合S的顶点。
- 每个顶点旁均标注了其对应的权重`d[v]`。图片底部的详细解释则对算法的运行逻辑进行了完整说明。
## 问答对
[
{ "role": "user", "content": "迪杰斯特拉算法用于解决哪类问题?" },
{ "role": "assistant", "content": "迪杰斯特拉算法用于求解从单个源顶点到图中其余所有顶点的最短路径问题。该算法采用贪心策略,通过选取权重最小的边来构建最短路径。" },
{ "role": "user", "content": "在演示示意图中,哪个是源顶点?" },
{ "role": "assistant", "content": "在演示示意图中,源顶点为顶点s,在图(a)中该顶点被标注为黑色。" },
{ "role": "user", "content": "为何图(b)至图(f)中的部分顶点被标注为黑色?" },
{ "role": "assistant", "content": "图(b)至图(f)中被标注为黑色的顶点,是已被加入集合S的顶点,即迪杰斯特拉算法已完成从源顶点到该顶点的最短路径求解的顶点。此类顶点已完成处理,其权重`d[v]`不再更新。" },
{ "role": "user", "content": "迪杰斯特拉算法基于何种原理运行?" },
{ "role": "assistant", "content": "迪杰斯特拉算法基于贪心原理运行。其每次都会选取当前权重最小的边,从当前顶点移动至相邻顶点,从而确保最终找到的路径为最短路径。" },
{ "role": "user", "content": "请结合演示示意图解释迪杰斯特拉算法的运行流程。" },
{ "role": "assistant", "content": "迪杰斯特拉算法的运行流程如下:
1. 初始化:将源顶点s加入集合S(图(a)中顶点s被标注为黑色),优先队列Q包含图中所有顶点。将源顶点s的权重`d[s]`设为0,其余顶点的权重设为无穷大。
2. 循环直至Q为空:
- 从Q中取出当前权重`d[u]`最小的顶点u(图(b)至图(f)中,顶点u被标注为黑色)。
- 将顶点u添加至集合S。
- 遍历与u相邻的顶点v,若`d[u] + 边(u,v)`的权重小于顶点v的当前权重`d[v]`,则更新顶点v的权重为`d[u] + 边(u,v)`的权重(例如在图(b)中,顶点u的权重`d[u]`为10,边(u,v)的权重为1,顶点v的初始权重为无穷大,由于10+1 < 无穷大,因此顶点v的权重被更新为11)。
3. 重复执行步骤2直至Q为空,此时即可得到从源顶点到图中所有顶点的最短路径。" }
]
<div style="display: grid; grid-template-columns: repeat(8, 150px); grid-gap: 10px;">
<img src="https://i.pinimg.com/474x/14/8c/d9/148cd95fe15cd816ed40639c778f59b5.jpg" style="width: 150px;">
<img src="https://i.pinimg.com/474x/87/97/46/87974618c7c55636b3e44f19c37119d6.jpg" style="width: 150px;">
<img src="https://i.pinimg.com/474x/36/e5/eb/36e5eb991cc1d88ffa8df54c2a3145e7.jpg" style="width: 150px;">
<img src="https://i.pinimg.com/474x/93/46/a6/9346a68ecb3c6f974b4a17a4567bda0b.jpg" style="width: 150px;">
<img src="https://i.pinimg.com/474x/3b/51/c8/3b51c85507e38d69710b99917e0b9927.jpg" style="width: 150px;">
</div>
# 引用
@misc{doan2024vintern1befficientmultimodallarge,
title={Vintern-1B: An Efficient Multimodal Large Language Model for Vietnamese},
author={Khang T. Doan and Bao G. Huynh and Dung T. Hoang and Thuc D. Pham and Nhat H. Pham and Quan T. M. Nguyen and Bang Q. Vo and Suong N. Hoang},
year={2024},
eprint={2408.12480},
archivePrefix={arXiv},
primaryClass={cs.LG},
url={https://arxiv.org/abs/2408.12480},
}
提供机构:
maas
创建时间:
2025-01-08



