five

BeamRL-TrainData

收藏
Hugging Face2026-03-04 更新2026-03-05 收录
下载链接:
https://huggingface.co/datasets/lamm-mit/BeamRL-TrainData
下载链接
链接失效反馈
官方服务:
资源简介:
BeamRL-TrainData 是一个合成的梁力学问答对数据集,用于通过可验证奖励信号的组相对策略优化(GRPO)训练 BeamPERL 模型。数据集包含 180 个独特的简支梁配置,每个配置通过符号计算解决,并配以自然语言问题和真实的反作用力答案。数据集详细记录了梁的长度、载荷类型、载荷位置等参数,并提供了剪切力、弯矩、斜率和挠度等分布数据。每个样本包含唯一的配置 ID、载荷位置、参数、坐标分布、力学分布数据及其极值点、梁段描述、外部反作用力、内部载荷表达式、旋转挠度表达式、自然语言问题及符号系数形式的答案。数据集适用于强化学习、结构工程和数学推理等任务。
提供机构:
LAMM: MIT Laboratory for Atomistic and Molecular Mechanics
创建时间:
2026-03-04
原始信息汇总

BeamRL-TrainData 数据集概述

数据集基本信息

  • 名称:BeamRL-TrainData
  • 用途:用于通过具有可验证奖励信号的组相对策略优化(GRPO)训练 BeamPERL 模型的梁力学问答对合成数据集。
  • 语言:英语
  • 许可协议:apache-2.0
  • 标签:强化学习、grpo、梁力学、结构工程、数学、推理、合成数据
  • 任务类别:问答、文本生成
  • 规模类别:n<1K
  • 数据行数:180

数据内容详情

  • 梁类型:简支梁(x=0处为铰支座,x=L处为滚轴支座)
  • 荷载类型:单个向下的集中荷载
  • 梁长度L2*L3*L
  • 集中荷载-P-2*P-3*P
  • 荷载位置:20个归一化位置(0.05 – 0.95 × L)
  • 答案格式:符号系数,例如 ["0.55P", "0.45P"]

数据列说明

列名 类型 描述
configuration_id int64 唯一行索引(0–179)
load_position float64 沿梁的归一化荷载位置(0.0–1.0)
parameters string 符号荷载/长度类别标识符(9个类别)
x_coordinates list[float] 离散化的梁位置(100–200个点)
shear_force list[float] 沿梁的剪力分布
bending_moment list[float] 沿梁的弯矩分布
slope list[float] 沿梁的转角/斜率分布
deflection list[float] 沿梁的挠度分布
shear_force_extrema string (JSON) 剪力的局部极值和过零点
bending_moment_extrema string (JSON) 弯矩的局部极值和过零点
slope_extrema string (JSON) 斜率的局部极值和过零点
deflection_extrema string (JSON) 挠度的局部极值和过零点
beam_points string (JSON) 支座和荷载点描述
beam_segments string (JSON) 分段材料和截面属性
exterior_reactions string (JSON) 符号外部反力
internal_loads string (JSON) 分段内剪力和弯矩表达式
rotation_deflection string (JSON) 分段转角和挠度表达式
problem list[string] 关于反力的自然语言问题
solution list[string] 作为符号系数字符串的真实答案

生成过程

  1. 梁配置:使用自定义版本的 SymBeam 库,为每种长度、荷载大小和荷载位置的组合构建一个简支梁。
  2. 符号求解:SymBeam 对梁进行解析求解,生成反力、剪力、弯矩、斜率和挠度的精确符号表达式。
  3. 问题生成:大型语言模型从符号梁描述中生成自然语言问题,询问支座处的反力。
  4. 答案提取:真实答案从求解的反力中直接提取为符号系数字符串。
  5. 上传:最终数据集上传至 HuggingFace Hub。

使用方式

加载数据集

python from datasets import load_dataset ds = load_dataset("tphage/BeamRL-TrainData")

与 BeamPERL 训练一起使用

python from datasets import load_dataset from beamrl.utils import make_conv_for_grpo, SYSTEM_PROMPT ds = load_dataset("tphage/BeamRL-TrainData", split="train") examples = [make_conv_for_grpo(ex, SYSTEM_PROMPT) for ex in ds]

引用

bibtex @misc{hage2025beamperl, title={BeamPERL: Parameter-Efficient Reinforcement Learning for Verifiable Beam Mechanics Problem-Solving}, author={Tarjei P. Hage and Markus J. Buehler}, year={2025}, archivePrefix={arXiv}, primaryClass={cs.CL} }

致谢

数据集生成使用了作者修改的自定义版 SymBeam。训练框架基于 Tina 和 Open R1 构建。

搜集汇总
数据集介绍
main_image_url
构建方式
在结构工程与计算力学领域,高质量的训练数据对于开发可靠的智能求解模型至关重要。BeamRL-TrainData的构建采用了一套系统化的合成生成流程:首先基于自定义的SymBeam符号计算库,针对简支梁结构,系统性地枚举了长度、荷载大小及荷载位置等参数组合,生成了180种独特的梁配置;随后通过符号解析方法精确求解了每种配置下的反力、剪力、弯矩、转角和挠度等力学响应;最后利用大型语言模型从符号描述中自动生成自然语言问题,并从解析解中提取出以符号系数形式表示的标准答案,从而确保了数据在数学上的精确性与问题表述的自然性。
使用方法
为便于研究与应用,数据集可通过Hugging Face的`datasets`库直接加载。用户可轻松访问其中的自然语言问题字段与符号答案字段。若用于训练BeamPERL模型,数据集提供了专用的工具函数`make_conv_for_grpo`,能够将原始数据条目与系统提示词结合,转换为适用于群组相对策略优化训练流程的对话格式。数据集中提取的符号系数答案可直接作为GRPO奖励函数的真值参考,通过解析模型输出中的`\boxed{}`格式内容并进行数值比较,为模型训练提供可验证的奖励信号。
背景与挑战
背景概述
在结构工程与计算力学领域,将符号推理与自然语言处理相结合,以解决专业工程问题,已成为前沿研究方向。BeamRL-TrainData数据集由Tarjei P. Hage和Markus J. Buehler于2025年创建,旨在为BeamPERL模型提供训练数据,通过可验证的奖励信号支持基于群组相对策略优化的强化学习。该数据集聚焦于简支梁力学分析,核心研究问题在于探索如何利用合成数据训练模型,使其能够准确理解并解答关于梁结构反力的自然语言问题,从而推动人工智能在工程符号计算与自动推理中的应用。
当前挑战
该数据集致力于解决结构工程中梁力学问题的自动符号求解与自然语言问答挑战,其核心难点在于确保模型输出与精确符号解在数值容差内的一致性。在构建过程中,挑战主要体现为如何系统生成涵盖多样化梁配置的合成数据,包括长度、载荷大小与位置参数的组合,并准确提取符号表达式作为真实答案。同时,将解析力学结果转化为自然语言问题,并保持问题与答案间严格的数学对应关系,亦对数据生成的可靠性与一致性提出了较高要求。
常用场景
经典使用场景
在结构工程与计算力学领域,BeamRL-TrainData数据集为强化学习模型提供了精准的训练基础。其经典使用场景在于通过符号化解析生成的梁力学问题-答案对,专门用于训练BeamPERL模型,采用可验证奖励信号的组相对策略优化方法。该数据集模拟了简支梁在单一集中荷载作用下的多种配置,涵盖了不同长度、荷载大小与位置组合,为模型学习力学推理与符号计算提供了结构化、可重复的实验环境。
解决学术问题
该数据集有效解决了计算力学中符号推理与自然语言处理结合的学术挑战。通过提供精确的解析解作为基准,它支持研究如何让机器学习模型掌握梁结构的力学行为,如反力计算、剪力与弯矩分布。其意义在于推动了可验证强化学习在工程问题中的应用,使模型输出不仅符合语言逻辑,更满足物理规律与数学精度,为跨学科研究提供了可靠的数据支撑。
实际应用
在实际工程应用中,BeamRL-TrainData可作为自动化结构分析与设计辅助工具的培训资源。例如,在建筑或桥梁的初步设计阶段,基于该数据集训练的模型能够快速估算支撑反力,辅助工程师进行荷载分析与安全评估。其符号化答案格式便于集成到计算机辅助工程软件中,提升设计效率与准确性,尤其适用于教育模拟与专业培训场景,帮助学习者直观理解梁力学原理。
数据集最近研究
最新研究方向
在结构工程与人工智能交叉领域,BeamRL-TrainData数据集正推动基于强化学习的符号推理研究。该数据集通过合成简支梁力学问题与答案对,为Group Relative Policy Optimization(GRPO)提供可验证的奖励信号,支持BeamPERL模型训练。前沿探索聚焦于将符号计算与自然语言处理相结合,以提升模型在工程力学问题中的精确推理能力。这一方向呼应了AI for Science热潮,特别是在物理信息机器学习领域,通过生成式方法增强模型对结构行为的理解,为自动化工程设计与安全评估开辟了新途径。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作