OG-MARL|多Agent强化学习数据集|人工智能数据集
收藏数据集概述
数据集简介
Offline Multi-Agent Reinforcement Learning (MARL) 数据集和基线,旨在通过使用静态数据集构建复杂多智能体系统的分散控制器,适用于实际应用。OG-MARL 提供了一系列多样化的数据集和基线,统一了 API 并提供了一套易于使用的工具。
数据集下载与使用
- 克隆仓库:
git clone https://github.com/instadeepai/og-marl.git
- 安装依赖:
pip install -e .
和pip install flashbax==0.1.2
- 下载环境依赖:例如使用 SMACv1:
bash install_environments/smacv1.sh
- 下载数据集:
python examples/download_dataset.py --env=smac_v1 --scenario=3m
- 运行基线:例如运行 MAICQ:
python baselines/main.py --env=smac_v1 --scenario=3m --dataset=Good --system=maicq
数据集 API
提供了一个演示笔记本,展示了如何使用 OG-MARL 的数据集 API:
支持的环境和场景
OG-MARL 支持多种流行的 MARL 环境,包括 Good
、Medium
、Poor
和 Replay
数据集,以基准测试不同数据质量下的离线 MARL 算法。
环境列表
环境 | 场景 | 智能体数量 | 动作类型 | 观测类型 | 奖励类型 | 类型 | 来源 |
---|---|---|---|---|---|---|---|
🔫SMAC v1 | 3m <br/> 8m <br/> 2s3z <br/> 5m_vs_6m <br/> 27m_vs_30m <br/> 3s5z_vs_3s6z <br/> 2c_vs_64zg | 3 <br/> 8 <br/> 5 <br/> 5 <br/> 27 <br/> 8 <br/> 2 | Discrete | Vector | Dense | Homog <br/> Homog <br/> Heterog <br/> Homog <br/> Homog <br/> Heterog <br/> Homog | source |
💣SMAC v2 | terran_5_vs_5 <br/> zerg_5_vs_5 <br/> terran_10_vs_10 | 5 <br/> 5 <br/> 10 | Discrete | Vector | Dense | Heterog | source |
🚅Flatland | 3 Trains <br/> 5 Trains | 3 <br/> 5 | Discrete | Vector | Sparse | Homog | source |
🐜MAMuJoCo | 2x3 HalfCheetah <br/> 2x4 Ant <br/> 4x2 Ant | 2 <br/> 2 <br/> 4 | Cont. | Vector | Dense | Heterog <br/> Homog <br/> Homog | source |
🐻PettingZoo | Pursuit <br/> Co-op Pong | 8 <br/> 2 | Discrete <br/> Discrete | Pixels <br/> Pixels | Dense | Homog <br/> Heterog | source |
来自先前工作的数据集
包括来自多个先前工作的数据集,例如:
- Pan et al. (2022) 的 MAMuJoCo 和 MPE 数据集
- Shao et al. (2023) 和 Wang et al. (2023) 的 SMAC v1 和 MAMuJoCo 数据集
引用
如果使用 OG-MARL 进行工作,请引用:
@inproceedings{formanek2023ogmarl, author = {Formanek, Claude and Jeewa, Asad and Shock, Jonathan and Pretorius, Arnu}, title = {Off-the-Grid MARL: Datasets and Baselines for Offline Multi-Agent Reinforcement Learning}, year = {2023}, publisher = {AAMAS}, booktitle = {Extended Abstract at the 2023 International Conference on Autonomous Agents and Multiagent Systems}, }

Google Scholar
Google Scholar是一个学术搜索引擎,旨在检索学术文献、论文、书籍、摘要和文章等。它涵盖了广泛的学科领域,包括自然科学、社会科学、艺术和人文学科。用户可以通过关键词搜索、作者姓名、出版物名称等方式查找相关学术资源。
scholar.google.com 收录
CE-CSL
CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。
arXiv 收录
AgiBot World
为了进一步推动通用具身智能领域研究进展,让高质量机器人数据触手可及,作为上海模塑申城语料普惠计划中的一份子,智元机器人携手上海人工智能实验室、国家地方共建人形机器人创新中心以及上海库帕思,重磅发布全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集开源项目 AgiBot World。这一里程碑式的开源项目,旨在构建国际领先的开源技术底座,标志着具身智能领域 「ImageNet 时刻」已到来。AgiBot World 是全球首个基于全域真实场景、全能硬件平台、全程质量把控的大规模机器人数据集。相比于 Google 开源的 Open X-Embodiment 数据集,AgiBot World 的长程数据规模高出 10 倍,场景范围覆盖面扩大 100 倍,数据质量从实验室级上升到工业级标准。AgiBot World 数据集收录了八十余种日常生活中的多样化技能,从抓取、放置、推、拉等基础操作,到搅拌、折叠、熨烫等精细长程、双臂协同复杂交互,几乎涵盖了日常生活所需的绝大多数动作需求。
github 收录
ChemBL
ChemBL是一个化学信息学数据库,包含大量生物活性数据,涵盖了药物发现和开发过程中的各种化学实体。数据集包括化合物的结构信息、生物活性数据、靶点信息等。
www.ebi.ac.uk 收录
CosyVoice 2
CosyVoice 2是由阿里巴巴集团开发的多语言语音合成数据集,旨在通过大规模多语言数据集训练,实现高质量的流式语音合成。数据集通过有限标量量化技术改进语音令牌的利用率,并结合预训练的大型语言模型作为骨干,支持流式和非流式合成。数据集的创建过程包括文本令牌化、监督语义语音令牌化、统一文本-语音语言模型和块感知流匹配模型等步骤。该数据集主要应用于语音合成领域,旨在解决高延迟和低自然度的问题,提供接近人类水平的语音合成质量。
arXiv 收录