five

ksfong/absolute-pareto-optimal-front-baseline-for-symbolic-regression

收藏
Hugging Face2024-06-10 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/ksfong/absolute-pareto-optimal-front-baseline-for-symbolic-regression
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为APO Front Baseline for Symbolic Regression,伴随论文《Absolute Pareto-Optimal Fronts for Real-World Symbolic Regression》发布。数据集主要用于符号回归(SR)任务,旨在找到描述数据集中变量关系的最佳闭式表达式。数据集包含了对34个真实世界数据集进行的绝对帕累托最优(APO)前沿分析,提供了所有评估表达式的原始数据、优化数值参数及其性能。此外,数据集还提取了每个真实世界数据集的APO前沿表达式,为SR算法提供了一个基准。数据集的创建者是国家新加坡大学的Kei Sen Fong,数据集采用cc-by-4.0许可证。

该数据集名为APO Front Baseline for Symbolic Regression,伴随论文《Absolute Pareto-Optimal Fronts for Real-World Symbolic Regression》发布。数据集主要用于符号回归(SR)任务,旨在找到描述数据集中变量关系的最佳闭式表达式。数据集包含了对34个真实世界数据集进行的绝对帕累托最优(APO)前沿分析,提供了所有评估表达式的原始数据、优化数值参数及其性能。此外,数据集还提取了每个真实世界数据集的APO前沿表达式,为SR算法提供了一个基准。数据集的创建者是国家新加坡大学的Kei Sen Fong,数据集采用cc-by-4.0许可证。
提供机构:
ksfong
原始信息汇总

数据集概述

本数据集为《Absolute Pareto-Optimal Fronts for Real-World Symbolic Regression》一文的配套数据集,专注于符号回归(Symbolic Regression, SR)任务中表达式的绝对帕累托最优(APO)前缘。数据集提供了针对SRBench中真实世界数据集的APO前缘表达式,以及每个评估表达式的优化数值参数和性能数据。

数据集内容

  • 数据结构:数据集包含两个主要部分:

    • APOv3和APOv4文件夹:包含所有评估表达式的原始数据,包括优化后的数值参数和R-squared得分。
    • Extracted_APO_Fronts文件夹:提取自APOv3和APOv4的APO前缘表达式,作为SR算法的基准。
  • 文件格式:所有数据文件为CSV格式,包含7个字段:

    1. EquationLength: 表达式长度
    2. EquationStructure: 表达式结构(不含数值参数)
    3. EquationLambda: 表达式结构(不含数值参数,代码形式)
    4. EquationParameters: 优化后的数值参数
    5. NumericalIterations: 数值优化方法的迭代次数
    6. MSE: 均方误差
    7. R2: R-squared得分

数据集用途

  • 基准测试:用于与真实世界数据集上的符号回归基准结果结合使用,例如NeuRIPS 2021的基准结果。
  • 算法评估:通过比较不同数值优化方法(如Broyden–Fletcher–Goldfarb–Shanno, BFGS)的性能,评估SR算法的选择。

数据集创建

  • 动机:为SRBench中的34个真实世界数据集提供APO前缘,作为SR算法效率和极限的基准。
  • 数据来源:数据由Kei Sen Fong在国家超级计算中心(新加坡)进行计算生成。

局限性

  • 优化方法:由于缺乏真正的全局数值优化方法,可能存在局部最优问题。
  • 函数集限制:由于计算资源限制,原始函数集中未包含所有可能的函数(如三角函数和对数函数)。

数据集联系人

  • 联系人:Kei Sen Fong (fongkeisen@u.nus.edu)
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作