BlindWays|盲人导航数据集|自动驾驶数据集

arXiv2024-12-07 更新2024-12-10 收录

盲人导航

自动驾驶

下载链接：

https://blindways.github.io/

下载链接

链接失效反馈

资源简介：

BlindWays数据集由波士顿大学、早稻田大学和马里兰大学帕克分校共同创建，是首个针对盲人行人多模态运动基准。该数据集包含11名盲人参与者在真实城市环境中导航的3D运动数据，共计1,029个运动片段和约0.6百万个人体姿态，以及2,058个详细的高低级文本描述。数据集通过穿戴式传感器收集，涵盖了盲人在动态户外环境中的自然运动数据，旨在解决现有3D人体运动数据集缺乏多样性和偏向视力正常人群的问题。BlindWays数据集的应用领域包括自动驾驶和社交机器人等辅助技术，旨在提高这些系统对残疾人运动的预测和响应能力，从而提升安全性。

提供机构：

波士顿大学、早稻田大学、马里兰大学帕克分校

创建时间：

2024-12-07

AI搜集汇总

数据集介绍

构建方式

在构建BlindWays数据集时，研究团队采用了多模态数据收集方法，通过穿戴式传感器记录了11名盲人参与者在真实城市环境中导航的3D运动数据。这些传感器包括Xsens的惯性测量单元（IMU），能够捕捉参与者与环境及导航辅助工具（如白手杖或导盲犬）的互动。此外，数据集还包含了丰富的文本描述，这些描述通过第三视角和第一视角的视频进行标注，详细记录了盲人步行者的运动特征及其与环境的互动策略。

特点

BlindWays数据集的显著特点在于其多模态数据的丰富性和真实性。该数据集不仅包含了高精度的3D运动数据，还结合了详细的文本描述，这些描述捕捉了盲人步行者在复杂城市环境中的独特运动模式和导航策略。此外，数据集中的参与者多样性，包括不同年龄、视觉障碍程度和使用不同辅助工具的个体，确保了数据的广泛代表性。

使用方法

BlindWays数据集可用于多种研究目的，包括但不限于3D人体运动预测模型的开发与评估、盲人导航行为的分析以及智能辅助系统的优化。研究者可以通过分析数据集中的运动数据和文本描述，开发能够理解和预测盲人步行者行为的算法。此外，该数据集还可用于训练和测试基于文本的3D运动生成模型，以提高模型在处理复杂和多样化的运动场景中的表现。

背景与挑战

背景概述

BlindWays数据集由波士顿大学、早稻田大学和马里兰大学的研究人员于2024年创建，旨在解决盲人步行者在真实城市环境中3D运动建模的空白。该数据集通过穿戴式传感器收集了11名盲人参与者在八条不同路线上的3D运动数据，并提供了丰富的文本描述，捕捉了盲人步行者的独特运动特征及其与导航辅助工具和环境的互动。BlindWays的引入填补了现有3D人体运动数据集在盲人运动多样性和真实性方面的不足，为开发更安全、更可靠的自主系统和车辆提供了重要资源。

当前挑战

BlindWays数据集面临的挑战主要集中在两个方面。首先，盲人步行者的运动特征与视觉正常者有显著差异，如在交叉路口的移动模式更为复杂，这使得现有的3D运动模型难以准确预测其行为。其次，数据集的构建过程中，如何通过穿戴式传感器准确捕捉盲人步行者在复杂城市环境中的细微运动变化，以及如何生成与运动数据同步的高质量文本描述，都是技术上的重大挑战。此外，数据集的样本量相对较小，仅为11名参与者，这可能限制了模型的泛化能力。

常用场景

经典使用场景

BlindWays数据集的经典使用场景主要集中在对盲人步行行为的3D建模与预测。通过穿戴式传感器收集的3D运动数据，结合详细的文本描述，研究人员能够深入分析盲人在复杂城市环境中的导航策略和行为特征。这种多模态数据集的构建，使得机器学习模型能够更好地理解和预测盲人的运动模式，从而为自动驾驶系统、社交机器人等应用提供更为精准和安全的人类行为模型。

解决学术问题

BlindWays数据集解决了现有3D人类运动数据集中缺乏对盲人群体代表性的问题。传统数据集多偏向于视力正常的人群，导致模型在处理盲人运动时表现不佳。该数据集通过引入盲人导航的真实数据，填补了这一研究空白，提升了模型的泛化能力和对特殊群体的适应性。这不仅有助于学术界在人类运动建模领域的深入研究，也为实际应用中的安全性和可靠性提供了理论支持。

衍生相关工作

BlindWays数据集的发布激发了大量相关研究工作，特别是在盲人导航和3D运动建模领域。例如，基于该数据集的研究已经提出了多种改进的3D运动预测模型，这些模型能够更好地捕捉盲人的细微运动特征。此外，还有研究致力于开发新的文本到运动生成模型，以实现更自然和多样化的盲人运动模拟。这些衍生工作不仅推动了技术的发展，也为未来的智能系统设计提供了新的思路。

以上内容由AI搜集并总结生成

用户留言

有没有相关的论文或文献参考？

这个数据集是基于什么背景创建的？

数据集的作者是谁？

能帮我联系到这个数据集的作者吗？

这个数据集如何下载？

点击留言

数据主题

具身智能

数据集 4098个

机构 8个

大模型

数据集 439个

机构 10个

无人机

数据集 37个

机构 6个

指令微调

数据集 36个

机构 6个

蛋白质结构

数据集 50个

机构 8个

空间智能

数据集 21个

机构 5个

5,000+

优质数据集

54 个

任务类型

进入经典数据集

热门数据集

SuMeyYao/ysmpubmedclt

该数据集的许可证为apache-2.0，主要用于表格问答任务，数据集语言为英语，大小介于1亿到10亿之间。

hugging_face 收录

Traditional-Chinese-Medicine-Dataset-SFT

该数据集是一个高质量的中医数据集，主要由非网络来源的内部数据构成，包含约1GB的中医各个领域临床案例、名家典籍、医学百科、名词解释等优质内容。数据集99%为简体中文内容，质量优异，信息密度可观。数据集适用于预训练或继续预训练用途，未来将继续发布针对SFT/IFT的多轮对话和问答数据集。数据集可以独立使用，但建议先使用配套的预训练数据集对模型进行继续预训练后，再使用该数据集进行进一步的指令微调。数据集还包含一定比例的中文常识、中文多轮对话数据以及古文/文言文<->现代文翻译数据，以避免灾难性遗忘并加强模型表现。

huggingface 收录

Med-MAT

Med-MAT是一个包含106个开源医学数据集的视觉问答（VQA）数据集，旨在推动医学多模态大语言模型（MLLMs）的泛化实验和训练。数据集通过将图像-标签对转换为VQA格式，展示了组合泛化（CG）是MLLMs理解未见图像的关键机制。数据集包括106个医学数据集的问答对、53个按模态、解剖区域和任务（MAT）分类的子集的问答对，以及部分数据集的图像下载链接。

huggingface 收录

红外谱图数据库

收集整理红外谱图实验手册等数据，建成了红外谱图数据库。本数据库收录了常见化合物的红外谱图。主要包括化合物数据和对应的红外谱图数据。其中，原始红外谱图都进行了数字化处理，从而使谱峰检索成为可能。用户可以在数据库中检索指定化合物的谱图，也可以提交谱图/谱峰数据，以检索与之相似的谱图数据，以协助进行谱图鉴定。

国家基础学科公共科学数据中心收录

中国空气质量数据集（2014-2020年）

数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI，包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台，每日更新。数据集的原始文件为CSV的文本记录，通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。

国家地球系统科学数据中心收录