BeamRL-EvalData

Name: BeamRL-EvalData
Creator: LAMM: MIT Laboratory for Atomistic and Molecular Mechanics
Published: 2026-03-04 19:13:29
License: 暂无描述

Hugging Face2026-03-04 更新2026-03-05 收录

下载链接：

https://huggingface.co/datasets/lamm-mit/BeamRL-EvalData

下载链接

链接失效反馈

官方服务：

资源简介：

BeamRL-EvalData 是一个合成的梁力学问答对数据集，专门用于评估 BeamPERL 模型。作为 BeamRL-TrainData 的配套评估集，它设计了更复杂、更多样的配置以测试模型的分布外泛化能力。数据集包含24个样本，涵盖1至3个同时作用的点载荷和可变支撑位置。梁的长度固定为 `9*L`，载荷大小为 `-13*P`。数据集详细记录了每个配置的载荷位置、支撑位置、剪切力、弯矩、斜率、挠度等力学分布，以及问题的自然语言描述和符号化答案。数据集适用于问答和文本生成任务，特别适合结构工程和数学推理领域的研究。

BeamRL-EvalData is a synthetic beam mechanics question-answering pair dataset specifically designed for evaluating the BeamPERL model. As a companion evaluation dataset for BeamRL-TrainData, it is configured with more complex and diverse settings to test the out-of-distribution generalization capability of the model. The dataset contains 24 samples, covering scenarios with 1 to 3 simultaneously applied point loads and variable support positions. The length of the beam is fixed at `9*L`, and the load magnitude is `-13*P`. The dataset thoroughly records the mechanical distributions such as load position, support position, shear force, bending moment, slope and deflection for each configuration, as well as the natural language descriptions of the questions and symbolic answers. This dataset is suitable for question answering and text generation tasks, and is particularly well-suited for research in the fields of structural engineering and mathematical reasoning.

提供机构：

LAMM: MIT Laboratory for Atomistic and Molecular Mechanics

创建时间：

2026-03-04

原始信息汇总

BeamRL-EvalData 数据集概述

数据集基本信息

名称：BeamRL-EvalData
类型：合成数据集
用途：用于评估 BeamPERL 模型
语言：英语
许可协议：Apache-2.0
任务类别：问答、文本生成
规模类别：小于1K条
标签：强化学习、GRPO、梁力学、结构工程、数学、推理、合成、评估

数据集详情

数据行数：24
梁类型：简支梁（铰支座 + 滚轴支座，位置可变）
荷载类型：1-3个同时作用的向下集中荷载
梁长度：9*L
荷载大小：每个荷载为 -13*P
荷载位置：明确指定（非均匀间隔）
支座位置：可变：[0.0, 1.0]、[0.0, 0.9]、[0.1, 1.0]、[0.1, 0.9]
答案格式：符号系数，例如 ["19.5P", "19.5P"]

配置分组

所有配置的梁长度均为 9*L，荷载为 -13*P。

组别	行数	描述
单荷载，默认支座	4	1个集中荷载，铰支座在x=0，滚轴支座在x=9L
双荷载，默认支座	4	2个集中荷载，铰支座在x=0，滚轴支座在x=9L
三荷载，默认支座	4	3个集中荷载，铰支座在x=0，滚轴支座在x=9L
右侧悬臂（滚轴支座在0.9L）	3	1-2个荷载，铰支座在x=0，滚轴支座在x=8.1L
左侧悬臂（铰支座在0.1L）	3	1-2个荷载，铰支座在x=0.9L，滚轴支座在x=9L
内部支座（0.1L–0.9L）	6	1-2个荷载，铰支座在x=0.9L，滚轴支座在x=8.1L

数据列说明

列名	类型	描述
`configuration_id`	int64	唯一行索引（0–23）
`load_position`	float64 (nullable)	第一个荷载位置，归一化（遗留列；多荷载行此值为`None`）
`load_positions`	list[float]	所有归一化荷载位置（1–3个元素）
`load_values`	list[string]	每个位置的荷载值字符串（例如 `["-13*P"]`）
`support_positions`	list[float]	归一化的铰支座和滚轴支座位置 `[pin, roller]`
`parameters`	string (JSON)	符号梁参数（`L`、`P`、`E`、`I` 等）
`x_coordinates`	list[float]	离散化的梁位置（200–400个点）
`shear_force`	list[float]	沿梁的剪力分布
`bending_moment`	list[float]	沿梁的弯矩分布
`slope`	list[float]	沿梁的转角/斜率分布
`deflection`	list[float]	沿梁的挠度分布
`shear_force_extrema`	string (JSON)	剪力的局部极值和过零点
`bending_moment_extrema`	string (JSON)	弯矩的局部极值和过零点
`slope_extrema`	string (JSON)	斜率的局部极值和过零点
`deflection_extrema`	string (JSON)	挠度的局部极值和过零点
`beam_points`	string (JSON)	支座和荷载点描述
`beam_segments`	string (JSON)	分段材料和截面属性
`exterior_reactions`	string (JSON)	符号外部反力
`internal_loads`	string (JSON)	分段内力和弯矩表达式
`rotation_deflection`	string (JSON)	分段转角和挠度表达式
`problem`	list[string]	关于反力的自然语言问题
`solution`	list[string]	真实答案，为符号系数字符串

生成过程

梁配置：使用自定义版本的 SymBeam 为 9*L 的梁求解24个明确的荷载配置。
符号求解：SymBeam 为每个配置计算反力、剪力、弯矩、斜率和挠度的精确符号表达式。
问题生成：量化后的 DeepSeek-R1-Distill-Qwen-7B 模型生成描述梁设置并询问支座反力的自然语言问题。
答案提取：从求解出的符号反力中提取真实反力值作为系数字符串。
上传：处理后的数据集上传至 HuggingFace Hub。

与 BeamRL-TrainData 的主要区别

属性	BeamRL-TrainData	BeamRL-EvalData
行数	180	24
梁长度	`L`、`2L`、`3L`	仅 `9*L`
荷载大小	`-P`、`-2P`、`-3P`	仅 `-13*P`
每个配置的荷载数	1	1、2 或 3
支座位置	固定（x=0， x=L）	可变（包括悬臂）
荷载位置	20个均匀间隔点	24个明确位置
离散化点数	100–200点	200–400点

使用示例

python from datasets import load_dataset ds = load_dataset("tphage/BeamRL-EvalData") print(ds["train"][0]["problem"]) print(ds["train"][0]["solution"])

引用

bibtex @misc{hage2025beamperl, title={BeamPERL: Parameter-Efficient Reinforcement Learning for Verifiable Beam Mechanics Problem-Solving}, author={Tarjei P. Hage and Markus J. Buehler}, year={2025}, archivePrefix={arXiv}, primaryClass={cs.CL} }

致谢

数据集生成使用了作者修改的自定义版本 SymBeam。训练框架基于 Tina 和 Open R1。

搜集汇总

数据集介绍

构建方式

在结构工程与计算力学领域，BeamRL-EvalData数据集的构建体现了对模型泛化能力的严谨评估需求。该数据集通过定制化的SymBeam符号计算工具，针对长度为9*L的简支梁，系统生成了24种具有挑战性的力学配置。这些配置涵盖了1至3个同时作用的点荷载，且支撑位置可变动，包括悬臂与内部支撑等训练数据未见的复杂情形。随后，利用量化后的DeepSeek-R1-Distill-Qwen-7B模型自动生成描述梁结构并询问支座反力的自然语言问题，同时从符号解中提取出以系数字符串形式呈现的真实答案，最终形成结构化的评估对。

特点

该数据集的核心特点在于其刻意设计的分布外泛化测试框架。所有样本均采用固定的梁长度9*L与荷载大小-13*P，但通过引入可变的支撑位置与多荷载组合，构造了比训练集更为复杂和多样的力学场景。数据集提供了从荷载位置、内力分布到变形曲线的全方位高精度离散数据，以及以符号系数表达的标准答案，确保了评估的精确性与可解释性。其紧凑的24个样本规模，精准覆盖了从单荷载到三荷载、从常规支撑到悬臂结构的六个难度层级，为评估模型在未见配置下的推理能力提供了高效基准。

使用方法

该数据集主要用于评估BeamPERL等模型在梁力学问题上的解决能力。用户可通过Hugging Face的datasets库直接加载数据集，便捷地访问每个样本包含的自然语言问题与对应的符号答案。为了与GRPO等强化学习框架集成，数据集配套提供了工具函数，能够将样本转换为包含系统提示的对话格式，方便进行端到端的模型性能测试。通过对比模型预测的支座反力与数据集中提供的精确符号解，研究者可以定量分析模型在复杂结构力学问题上的符号推理与泛化性能。

背景与挑战

背景概述

在结构工程与计算力学交叉领域，合成数据集的发展为验证机器学习模型在复杂物理问题上的推理能力提供了关键基准。BeamRL-EvalData数据集由Tarjei P. Hage与Markus J. Buehler于2025年创建，作为BeamPERL模型的专用评估集，旨在测试强化学习模型在梁力学问题中的泛化性能。该数据集聚焦于简支梁在变位支撑与多点荷载作用下的反应力计算，通过引入固定梁长（9*L）与荷载幅值（-13*P）的符号化配置，系统考察模型在分布外场景下的符号推理与数值解析能力，为工程智能系统的可验证性问题求解奠定了数据基础。

当前挑战

该数据集致力于解决梁力学中反应力计算的符号推理挑战，其核心难点在于模型需从自然语言问题描述中解析变位支撑、多点荷载等复杂边界条件，并输出精确的符号系数答案。构建过程中的挑战主要体现在生成具有高泛化难度的合成配置：需设计涵盖单点至三点荷载、支撑位置可变（包括悬臂与内部支撑）的24种显式配置，同时确保通过SymBeam工具进行符号求解的数值稳定性，并利用量化语言模型生成与力学原理一致的自然语言问题，以平衡数据多样性、物理正确性与评估严谨性。

常用场景

经典使用场景

在结构工程与力学推理领域，BeamRL-EvalData数据集主要用于评估强化学习模型在梁力学问题求解中的泛化能力。该数据集通过设计超出训练分布范围的复杂配置，包括可变支撑位置和多重荷载组合，为研究者提供了验证模型在非典型边界条件下性能的标准化测试平台。其核心应用场景聚焦于检验模型对符号化力学表达的理解与推导能力，特别是在处理多荷载叠加、悬臂结构及内部支撑等复杂工况时的推理鲁棒性。

衍生相关工作

该数据集直接衍生了BeamPERL模型的研究工作，开创了参数高效强化学习在可验证力学问题求解中的新范式。相关研究进一步推动了符号计算与神经网络融合的跨学科探索，例如基于SymBeam的符号引擎增强方法、面向结构工程的少样本推理框架等。这些工作共同构建了力学领域专用评估基准的生态系统，激励后续研究关注专业领域知识的可解释性嵌入与分布外泛化能力的系统性提升。

数据集最近研究