yoshitomo-matsubara/srsd-feynman_medium_dummy
收藏Hugging Face2024-03-05 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/yoshitomo-matsubara/srsd-feynman_medium_dummy
下载链接
链接失效反馈官方服务:
资源简介:
SRSD-Feynman (Medium w/ Dummy Variables)数据集旨在讨论符号回归在科学发现中的表现。该数据集包含40个不同的物理公式,并引入了虚拟变量(dummy variables),这些虚拟变量不应被符号回归模型用于预测。数据集的结构包括训练、验证和测试集,每个公式的样本数量分别为8,000、1,000和1,000。数据集的创建基于Feynman符号回归数据库,并对变量范围进行了修订,以确保其符合典型物理实验的条件。数据集的主要用途是评估符号回归方法的潜力,例如是否能够从数据中重新发现物理定律。
SRSD-Feynman (Medium w/ Dummy Variables)数据集旨在讨论符号回归在科学发现中的表现。该数据集包含40个不同的物理公式,并引入了虚拟变量(dummy variables),这些虚拟变量不应被符号回归模型用于预测。数据集的结构包括训练、验证和测试集,每个公式的样本数量分别为8,000、1,000和1,000。数据集的创建基于Feynman符号回归数据库,并对变量范围进行了修订,以确保其符合典型物理实验的条件。数据集的主要用途是评估符号回归方法的潜力,例如是否能够从数据中重新发现物理定律。
提供机构:
yoshitomo-matsubara
原始信息汇总
数据集概述
数据集名称
- 名称: SRSD-Feynman (Medium w/ Dummy Variables)
数据集描述
- 摘要: 该数据集旨在评估符号回归在科学发现中的性能,基于Feynman符号回归数据库设计,包含40个不同的物理公式。数据集中的虚拟变量是随机生成的,不应作为预测的一部分。
- 任务: 符号回归
- 语言: 英语
- 许可证: Creative Commons Attribution 4.0 (cc-by-4.0)
- 数据集大小: 100K<n<1M
数据集结构
- 数据实例: 每个实例包括表格数据和目标函数的真实方程。表格数据为(num_samples, num_variables+1)格式,其中最后一列表示目标函数在给定变量下的输出。
- 数据字段: 每个数据集包含训练、验证和测试分割的文本文件,以及真实方程的pickle文件。
- 数据分割: 训练集8,000样本/公式,验证集和测试集各1,000样本/公式。
数据集创建
- 来源数据: 基于Feynman符号回归数据库。
- 注释过程: 变量范围根据物理实验定义,通常在log尺度上采样,以适应大范围的变化。
- 注释者: Naoya Chiba (@nchiba) 和 Ryo Igarashi (@rigarash)
使用数据注意事项
- 社会影响: 该数据集支持符号回归在科学发现中的研究,有助于讨论数据驱动科学发现的潜力。
- 偏见讨论: 数据集基于物理领域的Feynman数据库,可能存在领域局限性。
- 其他限制: 某些变量应为整数,但因技术限制被处理为浮点数。
附加信息
- 数据集管理员: Naoya Chiba (@nchiba) 和 Ryo Igarashi (@rigarash)
- 贡献者: Yoshitomo Matsubara (@yoshitomo-matsubara), Naoya Chiba (@nchiba), Ryo Igarashi (@rigarash), Yoshitaka Ushiku (@yushiku)



