mheight_function_9

Hugging Face2025-08-09 更新2025-08-10 收录

下载链接：

https://huggingface.co/datasets/ACDRepo/mheight_function_9

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含了9个元素的排列，每个排列都标记有其mHeight值。mHeight是一个与排列中的3412模式相关的统计量，用于研究Kazhdan-Lusztig多项式系数。数据集分为训练集和测试集，可用于分类任务，以预测排列的mHeight值。

创建时间：

2025-07-26

搜集汇总

数据集介绍

构建方式

在代数组合学领域，mHeight_function_9数据集的构建依托于SageMath计算平台，系统枚举了九元排列的所有可能情况。每个排列均以单行记号形式呈现，并通过精确算法检测其中的3412模式实例，计算其高度并取最小值作为mHeight标签。该过程确保了数学定义的严格遵循与数据生成的全面性，为机器学习任务提供了坚实基础。

使用方法

研究者可将该数据集应用于分类任务，旨在通过机器学习模型重新发现mHeight这一数学概念。输入为排列的序列表示，输出为对应的mHeight类别。基准测试表明，Transformer等先进模型能近乎完美地学习这一映射，为验证模型在纯数学概念学习上的能力提供了重要平台。

背景与挑战

背景概述

在代数组合学与表示理论的交叉领域，mHeight_function_9数据集由太平洋西北国家实验室的Herman Chau团队于2025年创建，旨在探索机器学习在纯数学证明中的潜在应用。该数据集源于Gaetz和Gao对Billey与Postnikov关于Kazhdan-Lusztig多项式系数猜想的突破性证明，其中mHeight函数作为刻画排列中3412模式最小高度的关键统计量，为理解舒伯特簇的几何性质提供了新的组合工具。

当前挑战

该数据集核心挑战在于从9元排列中精确识别mHeight值，其分类任务需处理高度不平衡的标签分布（如mHeight=5仅含1个训练样本）。构建过程中需高效枚举所有9!种排列并计算其3412模式的最小高度，涉及组合爆炸与算法优化问题；同时，机器学习模型需从排列结构中推断非显式定义的组合统计量，对模型抽象推理能力提出极高要求。

常用场景

经典使用场景

在代数组合学与计算数学交叉领域，该数据集为研究排列的3412模式特性提供了标准化的实验平台。其核心应用场景在于通过机器学习方法重新发现mHeight函数的数学定义，模型需要从九元排列的一行表示中识别出所有3412模式的最小高度值，这要求算法具备捕捉组合结构的深层模式识别能力。

解决学术问题

该数据集直接关联Kazhdan-Lusztig多项式系数的Billey-Postnikov猜想验证，通过量化排列中3412模式的高度特征，为代数几何中Schubert簇的光滑性研究提供了组合工具。其意义在于搭建了机器学习与纯数学证明之间的桥梁，探索非平凡数学概念能否通过数据驱动方式重新发现，推动了计算组合学的方法论创新。

实际应用

除理论数学研究外，该数据集可应用于组合优化算法的验证框架，特别是在模式避免与排列统计领域。其标注数据能为组合结构生成模型提供训练基准，同时有助于开发新型代数计算软件的模式检测模块，为数学软件集成机器学习组件提供实证基础。

数据集最近研究