five

长期信息鲁棒博弈表征开源算法库

收藏
国家基础学科公共科学数据中心2026-05-02 收录
下载链接:
https://nbsdc.cn/general/dataDetail?id=69f37ceff175603f06871e8c&type=1
下载链接
链接失效反馈
官方服务:
资源简介:
本数据集为科技创新2030—“新一代人工智能”重大项目执行过程中形成的长期信息鲁棒博弈表征开源算法库,面向视觉强化学习中背景变化、颜色扰动等视觉干扰条件下的泛化决策与高效学习问题。数据集以长期信息建模为主线,综合支撑 ROUSER 鲁棒动作价值表征学习与基于频域预测的长期特征提取两项代表性研究。数据主体为 1 个压缩包,一级目录为 ROUSER,包含 Python 源代码、批处理脚本、依赖说明和实验日志等文件,覆盖标准视觉强化学习仿真平台上的连续与离散控制任务。数据采集采用统一环境配置、算法参数和随机种子,自动记录观测、动作、奖励、状态转移及中间表征,并通过异常实验剔除、结构化整理和脚本化封装保证数据质量。数据量约 10 MB,计划于 2026 年 2 月公开,采用完全共享方式,可为视觉强化学习泛化、长期信息表征和鲁棒决策研究提供可复用的代码与实验基础。
提供机构:
中国科学技术大学
二维码
社区交流群
二维码
科研交流群
商业服务