ksfong/absolute-pareto-optimal-front-baseline-for-symbolic-regression
收藏Hugging Face2024-06-10 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/ksfong/absolute-pareto-optimal-front-baseline-for-symbolic-regression
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为APO Front Baseline for Symbolic Regression,伴随论文《Absolute Pareto-Optimal Fronts for Real-World Symbolic Regression》发布。数据集主要用于符号回归(SR)任务,旨在找到描述数据集中变量关系的最佳闭式表达式。数据集包含了对34个真实世界数据集进行的绝对帕累托最优(APO)前沿分析,提供了所有评估表达式的原始数据、优化数值参数及其性能。此外,数据集还提取了每个真实世界数据集的APO前沿表达式,为SR算法提供了一个基准。数据集的创建者是国家新加坡大学的Kei Sen Fong,数据集采用cc-by-4.0许可证。
该数据集名为APO Front Baseline for Symbolic Regression,伴随论文《Absolute Pareto-Optimal Fronts for Real-World Symbolic Regression》发布。数据集主要用于符号回归(SR)任务,旨在找到描述数据集中变量关系的最佳闭式表达式。数据集包含了对34个真实世界数据集进行的绝对帕累托最优(APO)前沿分析,提供了所有评估表达式的原始数据、优化数值参数及其性能。此外,数据集还提取了每个真实世界数据集的APO前沿表达式,为SR算法提供了一个基准。数据集的创建者是国家新加坡大学的Kei Sen Fong,数据集采用cc-by-4.0许可证。
提供机构:
ksfong
原始信息汇总
数据集概述
本数据集为《Absolute Pareto-Optimal Fronts for Real-World Symbolic Regression》一文的配套数据集,专注于符号回归(Symbolic Regression, SR)任务中表达式的绝对帕累托最优(APO)前缘。数据集提供了针对SRBench中真实世界数据集的APO前缘表达式,以及每个评估表达式的优化数值参数和性能数据。
数据集内容
-
数据结构:数据集包含两个主要部分:
- APOv3和APOv4文件夹:包含所有评估表达式的原始数据,包括优化后的数值参数和R-squared得分。
- Extracted_APO_Fronts文件夹:提取自APOv3和APOv4的APO前缘表达式,作为SR算法的基准。
-
文件格式:所有数据文件为CSV格式,包含7个字段:
- EquationLength: 表达式长度
- EquationStructure: 表达式结构(不含数值参数)
- EquationLambda: 表达式结构(不含数值参数,代码形式)
- EquationParameters: 优化后的数值参数
- NumericalIterations: 数值优化方法的迭代次数
- MSE: 均方误差
- R2: R-squared得分
数据集用途
- 基准测试:用于与真实世界数据集上的符号回归基准结果结合使用,例如NeuRIPS 2021的基准结果。
- 算法评估:通过比较不同数值优化方法(如Broyden–Fletcher–Goldfarb–Shanno, BFGS)的性能,评估SR算法的选择。
数据集创建
- 动机:为SRBench中的34个真实世界数据集提供APO前缘,作为SR算法效率和极限的基准。
- 数据来源:数据由Kei Sen Fong在国家超级计算中心(新加坡)进行计算生成。
局限性
- 优化方法:由于缺乏真正的全局数值优化方法,可能存在局部最优问题。
- 函数集限制:由于计算资源限制,原始函数集中未包含所有可能的函数(如三角函数和对数函数)。
数据集联系人
- 联系人:Kei Sen Fong (fongkeisen@u.nus.edu)



