DeepMind Control Vision Benchmark (DMC-VB)|强化学习数据集|视觉控制数据集
收藏DeepMind Control Vision Benchmark (DMC-VB)
数据集概述
DMC-VB 是一个用于评估和基准化在视觉干扰环境下控制任务的表示学习方法的数据集。该数据集包含基于 DM Control Suite 的 3 个运动任务和 7 个蚂蚁迷宫(运动 + 导航)任务的收集片段。
数据集组成
- 运动任务:包含 3 个不同的运动任务(不同的实体),每个任务在不同的行为策略技能水平下收集数据。每个单元格中的视频分别展示了无干扰、静态干扰和动态干扰下的单个片段。每个数据子集包含 2000 个片段(或 100 万步)。
- 蚂蚁迷宫任务:包含 7 个不同的迷宫任务,每个任务对应不同的迷宫布局。数据集通过 4 种不同的地板和墙壁纹理来实现视觉变化。每个数据子集包含 100 万步。
数据下载
数据集存储在 Google Cloud Platform (GCP) 的 dmc_vision_benchmark
存储桶中,总大小约为 1.6TB。用户可以通过 gcloud CLI 下载完整数据集或其子集。
安装与使用
数据集的安装和使用需要下载 GitHub 仓库,并通过 pip 安装相关包。提供了示例脚本和配置文件,用户可以根据需要调整路径和配置。
代理与表示学习方法
数据集支持多种代理和表示学习方法,包括行为克隆(BC)、TD3-BC 等,以及视觉编码器的预训练方法,如逆动力学模型、潜在前向模型等。
基准测试
数据集包含 3 个基准测试脚本,用于复现论文中的实验结果,分别研究视觉表示学习对干扰的鲁棒性、混合质量数据对有限专家数据的改进以及任务中随机隐藏目标对固定隐藏目标和有限专家数据的改进。
引用
如需引用此工作,请使用提供的 BibTeX 格式。
许可证
软件部分采用 Apache 2.0 许可证,其他材料采用 Creative Commons Attribution 4.0 International License (CC-BY)。

- 1DMC-VB: A Benchmark for Representation Learning for Control with Visual Distractors谷歌DeepMind · 2024年
CatMeows
该数据集包含440个声音样本,由21只属于两个品种(缅因州库恩猫和欧洲短毛猫)的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定,包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外,还有一个额外的zip文件,包含被排除的录音(非喵声)和未剪辑的连续发声序列。
huggingface 收录
中国农村金融统计数据
该数据集包含了中国农村金融的统计信息,涵盖了农村金融机构的数量、贷款余额、存款余额、金融服务覆盖率等关键指标。数据按年度和地区分类,提供了详细的农村金融发展状况。
www.pbc.gov.cn 收录
MedDialog
MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。
github 收录
AISHELL/AISHELL-1
Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。
hugging_face 收录
LIDC-IDRI
LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。
OpenDataLab 收录