gregb/sudoku-padic-regression-experiments

Name: gregb/sudoku-padic-regression-experiments
Creator: gregb
Published: 2026-04-25 08:22:00
License: 暂无描述

Hugging Face2026-04-25 更新2026-04-26 收录

下载链接：

https://hf-mirror.com/datasets/gregb/sudoku-padic-regression-experiments

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含了用于论文Signed p-adic Residual Encodings of Finite-Domain All-Different Systems with a Sudoku Case Study的小型可重复性数据包。数据包包括：实验结果的CSV文件、两个实验运行的摘要文件、绘制的示例的跟踪谜题和解决方案文件、损失曲线源文件以及用于生成输出的Python脚本。实验表是通过源代码库重新生成的，包括使用不同方法（stepwise和zubarev）运行的实验。谜题是从已解决的网格中随机提取的，未进行唯一性检查。计算声明是说明性的，而非竞争性的数独解决声明。

This dataset contains the small reproducibility bundle for the manuscript Signed p-adic Residual Encodings of Finite-Domain All-Different Systems with a Sudoku Case Study. The bundle includes: CSV files of experiment results, summary files for both experiment runs, trace puzzle and solution files for the plotted examples, loss-curve source files, and the Python scripts used to generate the outputs. The experiment table is regenerated from the source repository, including experiments run with different methods (stepwise and zubarev). The puzzles are randomly carved from solved grids and are not uniqueness-checked. The computational claims are illustrative rather than competitive Sudoku-solving claims.

提供机构：

gregb

搜集汇总

数据集介绍

构建方式

该数据集来源于对《Signed p-adic Residual Encodings of Finite-Domain All-Different Systems with a Sudoku Case Study》手稿的可复现性验证实验。构建过程基于Python脚本，通过执行`run_experiments.py`程序，分别在stepwise和zubarev两种方法下生成实验数据。实验采用随机从已求解的数独网格中挖空谜题的方式，未进行唯一性检查，并设定了种子、网格维度、线索数量、最大迭代步数和重启次数等参数，以确保结果的可复现性。

特点

数据集聚焦于数独问题的p-adic残差编码与局部搜索算法的结合，包含stepwise和zubarev两种方法下的实验结果CSV文件、摘要文件、示例谜题与解答文件、损失曲线源文件以及生成输出的Python脚本。所有数据均服务于科研可复现性目的，而非追求数独求解性能。数据集结构清晰，涵盖从原始实验配置到最终结果的完整链条，便于研究者验证和扩展相关理论。

使用方法

用户可直接从HuggingFace数据集页面下载整个压缩包，解压后获得`data`目录下的实验数据与`code`目录下的Python脚本。通过复现命令`python3 code/run_experiments.py`并调整参数（如种子、网格维度、线索数量、方法等），可重新生成实验表格与曲线。数据以标准CSV格式存储，兼容Pandas等数据分析工具，适合进行回归分析、性能对比与可视化研究。

背景与挑战

背景概述

该数据集由研究团队于近期创建，旨在支持一篇探讨“带符号p-adic残差编码在有限域全不同系统中的应用”的手稿，并以数独为案例进行实证分析。核心研究问题聚焦于如何利用p-adic数论中的残差编码方法，高效编码数独谜题中的全不同约束，进而通过回归实验验证编码的有效性。作为该领域的一项探索性工作，数据集提供了可复现的实验流程，包括逐步优化与Zubarev方法两种求解策略的比较，为后续研究者在组合约束满足问题与数论编码交叉方向上的深入探索奠定了数据基础。

当前挑战

该数据集主要应对两方面的挑战。其一，领域问题层面，数独求解作为典型的约束满足问题，其核心挑战在于高效编码数字1至9间的全不同约束，传统二进制或整数编码在搜索空间与求解效率上存在局限，而p-adic残差编码虽理论上能提供更紧凑的表示，但其在复杂逻辑约束下的实际性能仍需系统验证。其二，构建过程中，数据集生成面临随机谜题不保证唯一解、实验参数（如线索数、最大步数）需精细调校以平衡计算资源与结果可靠性的挑战，且研究团队明确指出计算结果的示意性而非竞争性，提示统计显著性与方法泛化性仍需进一步检验。

常用场景

经典使用场景

该数据集是数独p-adic残差回归实验的可复现性数据包，主要服务于对有限域全差异系统的符号p-adic残差编码这一前沿数学框架的实证研究。经典使用场景聚焦于利用p-adic数论特性，将数独约束满足问题转化为回归任务，通过局部搜索算法（如逐步回归与Zubarev方法）求解数独谜题。研究者常借助该数据集来比较不同编码策略（如beta调度参数）对求解效率与收敛性的影响，从而验证p-adic残差表示在组合优化问题中的理论可行性。

解决学术问题

该数据集针对数独求解中约束编码的数学结构优化这一学术难题，提出了基于p-adic残差的符号表示方法，突破了传统整数规划或SAT求解的范式。它解决了如何在有限域内利用p-adic编码的代数性质，高效表达全差异约束（如数独中行列宫互异）并转化为连续优化问题的关键挑战。其意义在于为组合数学与数值优化架设桥梁，推动了p-adic方法在约束满足问题（CSP）领域的理论验证，并为算法可复现性树立了规范。

衍生相关工作

围绕该数据集衍生出的经典工作包括：基于p-adic编码的随机局部搜索算法改进（如自适应beta调度策略），以及将类似编码思路推广至拉丁方、数独变体等组合设计问题。部分研究进一步混合符号回归与神经引导搜索，探索p-adic特征在深度学习约束优化中的应用。同时，该数据集的公开可复现包促进了算法比较基准的统一，催生了更多关于p-adic解析延拓在组合系统编码中普适性的理论分析论文。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集