five

多智能体专家示范数据集

收藏
国家基础学科公共科学数据中心2026-01-30 收录
下载链接:
https://nbsdc.cn/general/dataDetail?id=67fb655f195d265448044c5b&type=1
下载链接
链接失效反馈
官方服务:
资源简介:
该数据包括训练过程中,监督员阻止智能体的危险动作,并提供示范动作后保存的数据集,数据集是mat文件,用于进行强化学习的监督损失训练,用于诱导多智能体学习专家示范的合作策略。 在强化学习的训练过程中,多智能体根据历史交互决定当前动作,如果此时产生危险动作,监督员会阻止该动作并提供示范动作,用于诱导智能体学习专家合作策略。:将人类干预时刻,多智能体的动作和观测分别存在"obs"和" agent_action"数组中,将人类提供的示范动作存入“human_action”数组中,将所有干预时刻的数据样本串联起来作为专家干预数据集并保存成mat文件。
提供机构:
东南大学
二维码
社区交流群
二维码
科研交流群
商业服务