LMRL-Gym
收藏arXiv2023-11-30 更新2024-06-21 收录
下载链接:
https://lmrl-gym.github.io/
下载链接
链接失效反馈官方服务:
资源简介:
LMRL-Gym数据集由加州大学伯克利分校创建,旨在为多轮强化学习提供基准测试。该数据集包含8个语言任务,涉及开放式对话和文本游戏,要求多个轮次的语言交互。数据集通过大型语言模型生成的合成数据创建,支持离线强化学习训练,并提供模拟器用于评估训练后的代理在多轮交互任务中的性能。数据集的应用领域包括复杂对话、游戏和工具使用,旨在解决语言模型在目标导向推理和规划中的挑战。
提供机构:
加州大学伯克利分校
创建时间:
2023-11-30



