grassmannian_cluster_algebras

Hugging Face2025-08-02 更新2025-08-03 收录

下载链接：

https://huggingface.co/datasets/ACDRepo/grassmannian_cluster_algebras

下载链接

链接失效反馈

官方服务：

资源简介：

Grassmannian cluster algebras and semistandard Young tableaux数据集包含了一系列半标准Young表，用于研究这些表是否能够索引Grassmannian簇代数中的簇变量。数据集专注于Gr(3,12)的情况，即包含3行12列的表，其中每个表的元素按照行弱递增和列严格递增的规则排列。数据集分为训练集和测试集，每个实例由一个SSYT及其是否索引簇变量的标签组成。

创建时间：

2025-08-01

搜集汇总

数据集介绍

构建方式

在代数组合学与数学物理交叉领域，Grassmannian簇代数数据集的构建依托于半标准杨表（SSYT）的代数表征。该数据集通过SageMath的Tableaux类中random_element方法随机生成3×4矩形杨表作为负样本，同时采用文献[2]的开源代码生成正样本，即对应簇变量的杨表。两类样本经严格标记后构成平衡数据集，其构建过程深度融合了组合数学的严谨性与机器学习的数据驱动理念。

特点

本数据集聚焦于Gr(3,12) Grassmann流形上秩为4的簇代数结构，所有杨表均为3行4列的矩形阵列，元素取值于1至12整数集且满足行弱增、列严增的组合约束。数据规模包含训练集148,658个实例与测试集37,164个实例，正负样本数量精确均衡。其核心特征在于通过精心设计的负样本生成策略，提升了分类任务的难度，促使模型学习更具鲁棒性的组合特征。

使用方法

研究者可通过GitHub公开的数据加载器读取杨表数据与二元标签，其中标签1表示对应杨表索引簇变量，0则表示非簇变量。该数据集支持逻辑回归、多层感知机及Transformer等模型的训练与评估，旨在通过机器学习模型预测杨表的簇变量属性，进而挖掘其组合规律。高性能模型（如Transformer准确率达99.5%）可为进一步的数学猜想提供可解释的代数组合特征。

背景与挑战

背景概述

Grassmann流形作为代数几何与量子场论研究中的核心数学对象，其坐标环的簇代数结构近年来成为组合代数领域的重要研究方向。该数据集由太平洋西北国家实验室的Herman Chau团队于2025年创建，旨在通过机器学习方法解决Chang、Duan、Fraser和Li提出的簇变量参数化问题——即如何通过半标准杨表（SSYT）的特征来精确识别Grassmann流形簇代数中的簇变量。这一研究不仅深化了对簇代数组合结构的理解，更为数学与人工智能的交叉研究提供了创新范式。

当前挑战

该数据集核心挑战在于Grassmann流形簇代数中簇变量的组合表征问题：现有理论仅能通过矩形形状SSYT的必要条件进行初步筛选，但缺乏充分条件的数学刻画。在数据构建过程中，负例样本的生成策略面临显著困难——需要确保负例与正例在表观特征上高度相似，从而迫使机器学习模型挖掘更深层的组合规律而非表面统计特征。这种高难度负例采样方法虽提升了模型的鲁棒性，但也大幅增加了分类任务的复杂性。

常用场景

经典使用场景

在代数组合学与数学物理交叉领域，该数据集为Grassmann流形簇代数研究提供了关键计算范式。其核心应用场景在于通过半标准杨表（SSYT）的二元分类问题，探索簇变量的组合表征机制。研究者利用机器学习模型识别3×12矩阵空间中满足弱递增行与严格递增列条件的矩形杨表，从而建立组合对象与代数结构的映射关系。

解决学术问题

该数据集有效解决了簇代数中簇变量的组合判定难题，突破了传统数学方法在复杂代数系统表征中的局限性。通过量化分析矩形杨表与簇变量的对应关系，为量子仿射代数和超对称杨-米尔斯理论提供了新的计算视角，显著推进了代数组合学在数学物理前沿领域的可计算化进程。

衍生相关工作

该数据集衍生出多项跨学科创新研究，包括Chang-Duan-Fraser-Li提出的量子仿射代数与Grassmannian对应理论，以及Cheung等人开发的簇代数机器学习分析框架。后续工作拓展到高维杨表的拓扑特征提取，推动了代数组合学与深度学习融合的新兴领域发展。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集