LearnItAnyway/Visual-Navigation-21k
收藏Hugging Face2023-07-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/LearnItAnyway/Visual-Navigation-21k
下载链接
链接失效反馈官方服务:
资源简介:
Visual Navigation 21K数据集旨在帮助视觉障碍者,包含来自AI Hub的道路图像,并对部分图像进行了标注。基于图像中障碍物的位置生成了描述,并基于描述生成了多轮对话。未来的计划包括制作韩语数据集、训练模型以及开发支持语音问答的设备接口。
Visual Navigation 21K数据集旨在帮助视觉障碍者,包含来自AI Hub的道路图像,并对部分图像进行了标注。基于图像中障碍物的位置生成了描述,并基于描述生成了多轮对话。未来的计划包括制作韩语数据集、训练模型以及开发支持语音问答的设备接口。
提供机构:
LearnItAnyway
原始信息汇总
Visual Navigation 21K Dataset 概述
数据集来源
- 数据集包含的路面图像来源于 AI Hub。
数据集内容
- 数据集中的
Bbox_3_new.zip文件夹内的图像已进行标注。
数据集描述
- 根据图像中障碍物的位置,生成了描述信息。
- 基于这些描述,生成了多轮对话。
未来计划
- 制作韩语版本的数据集。
- 训练模型(例如,Vis-Nav-LLaVA)。
- 开发一个设备(如手机)的界面,支持语音提问和语音回答功能。



