five

LassoBench

收藏
arXiv2022-06-10 更新2024-07-24 收录
下载链接:
https://github.com/ksehic/LassoBench
下载链接
链接失效反馈
官方服务:
资源简介:
LassoBench是由瑞典隆德大学的研究团队开发的高维超参数优化基准套件,专注于加权Lasso回归模型。该数据集包含6个基准,包括合成和真实世界数据集,用于评估和比较不同的高维超参数优化算法。LassoBench旨在通过提供一个平台,帮助研究人员改进和扩展高维Lasso设置下的算法,特别是在金融、基因组学和脑成像等领域的应用。

LassoBench is a high-dimensional hyperparameter optimization benchmark suite developed by a research team at Lund University, Sweden, focusing on weighted Lasso regression models. This dataset includes six benchmarks, covering both synthetic and real-world datasets, which are utilized to evaluate and compare various high-dimensional hyperparameter optimization algorithms. LassoBench aims to provide a platform to help researchers improve and extend algorithms under high-dimensional Lasso settings, especially for applications in fields such as finance, genomics, and brain imaging.
提供机构:
隆德大学, 瑞典
创建时间:
2021-11-04
原始信息汇总

LassoBench 数据集概述

概述

LassoBench 是一个基于加权 Lasso 回归的高维超参数优化基准库。目标是在最小二乘估计和促进稀疏性的惩罚项之间优化多维超参数空间。搜索空间范围定义在 [-1, 1] 之间。

基准类型

LassoBench 包含两个类:

  • SyntheticBenchmark:涵盖合成条件下的基准。
  • RealBenchmark:基于医学和金融领域的实际应用。

基准功能

每个基准类都包含以下方法:

  • .evaluate:用于评估目标函数。
  • .test:提供后处理指标,如测试数据上的均方误差(MSE)和合成基准的 F 分数。
  • .fidelity_evaluate:用于评估多保真度框架。

示例代码

无噪声合成基准

python import numpy as np import LassoBench synt_bench = LassoBench.SyntheticBenchmark(pick_bench=synt_simple) d = synt_bench.n_features random_config = np.random.uniform(low=-1.0, high=1.0, size=(d,)) loss = synt_bench.evaluate(random_config)

有噪声合成基准

python import numpy as np import LassoBench synt_bench = LassoBench.SyntheticBenchmark(pick_bench=synt_simple, noise=True) d = synt_bench.n_features random_config = np.random.uniform(low=-1.0, high=1.0, size=(d,)) loss = synt_bench.evaluate(random_config)

实际应用基准

python import numpy as np import LassoBench real_bench = LassoBench.RealBenchmark(pick_data=RCV1) d = real_bench.n_features random_config = np.random.uniform(low=-1.0, high=1.0, size=(d,)) loss = real_bench.evaluate(random_config)

合成基准列表

名称 维度 轴对齐子空间
synt_simple 60 3
synt_medium 100 5
synt_high 300 15
synt_hard 1000 50

实际应用基准列表

名称 维度 近似轴对齐子空间
Breast_cancer 10 3
Diabetes 8 5
Leukemia 7129 22
DNA 180 43
RCV1 19959 75
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
LassoBench是由瑞典隆德大学开发的高维超参数优化基准套件,专注于加权Lasso回归模型,包含6个合成和真实世界基准数据集,用于评估和比较优化算法。它旨在帮助研究人员改进高维Lasso设置下的算法,并应用于金融、基因组学和脑成像等领域。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作