RoboData|机器人数据集|数据融合数据集
收藏RoboMM: All-in-One Multimodal Large Model for Robotic Manipulation
数据集概述
- 数据集名称: RoboData
- 数据集描述: RoboData 是一个综合性的机器人操作数据集,整合了多个知名数据集,实现了多视角图像、相机参数、深度图和动作的首次融合,并通过空间对齐促进从多样化机器人数据集中进行全面学习。
数据集特点
- 多模态融合: 整合了多视角图像、相机参数、深度图和动作。
- 空间对齐: 通过空间对齐促进从多样化机器人数据集中进行全面学习。
- 统一物理空间: 提供统一的物理空间,使得模型能够在多个数据集的所有任务中同时进行评估。
数据集来源
- CALVIN: https://github.com/mees/calvin
- Meta-World: https://github.com/Farama-Foundation/Metaworld
- LIBERO: https://github.com/Lifelong-Robot-Learning/LIBERO
- RoboCasa: https://github.com/robocasa/robocasa
- RoboMimic: https://github.com/ARISE-Initiative/robomimic
- RoboCAS: https://github.com/notFoundThisPerson/RoboCAS-v0
- RLBench: https://github.com/stepjam/RLBench
- Colosseum: https://github.com/robot-colosseum/robot-colosseum
- Maniskill2: https://github.com/haosulab/ManiSkill/tree/v0.5.3
数据集应用
- 模型训练: 用于训练多模态机器人操作模型 RoboMM。
- 模型评估: 提供完整的评估系统,支持跨数据集和跨任务的评估。
数据集性能
- CALVIN 数据集上的平均序列长度提升: 从 1.7 提升到 3.3。
- 跨体现能力: 在多个数据集上实现了最先进的结果。
数据集引用
@misc{yan2024robomm, title={RoboMM: All-in-One Multimodal Large Model for Robotic Manipulation}, author={Feng Yan and Fanfan Liu and Liming Zheng and Yufeng Zhong and Yiyang Huang and Zechao Guan and Chengjian Feng and Lin Ma}, year={2024}, eprint={2412.07215}, archivePrefix={arXiv}, primaryClass={cs.RO}, url={https://arxiv.org/abs/2412.07215}, }

LFW
人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download
AI_Studio 收录
CE-CSL
CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。
arXiv 收录
中国交通事故深度调查(CIDAS)数据集
交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、
北方大数据交易中心 收录
AISHELL/AISHELL-1
Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。
hugging_face 收录
MedDialog
MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。
github 收录