Sudoku Puzzles with Difficulty Metrics by Human Players

github2024-05-01 更新2024-05-31 收录

下载链接：

https://github.com/synnwang/sudoku_dataset_difficulty

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含由人类玩家体验的Sudoku谜题难度，用于评估Sudoku游戏难度评级算法的性能。数据集基于人类玩家的游玩时间和成功解决率构建，提供两种难度指标：$D_{TO}$（仅考虑解谜时间）和$D_{TR}$（考虑解谜时间和完成率）。

This dataset encompasses the difficulty levels of Sudoku puzzles as experienced by human players, designed to evaluate the performance of Sudoku game difficulty rating algorithms. The dataset is constructed based on the playing time and success rate of human players, offering two difficulty metrics: $D_{TO}$ (considering only the solving time) and $D_{TR}$ (considering both the solving time and the completion rate).

创建时间：

2024-04-11

原始信息汇总

数据集概述

数据集名称

A Dataset of Sudoku Puzzles with Difficulty Metrics by Human Players

数据集目的

构建一个包含由人类玩家体验的难度指标的数独谜题数据集，用于评估数独难度评级算法。

数据集特点

数据集基于人类玩家的实际游戏记录。
包含两种难度指标：
- $D_{TO}$: 仅考虑解谜时间。
- $D_{TR}$: 同时考虑解谜时间和完成率。

数据收集方法

通过开发名为Cloud Sudoku的Android应用程序收集原始数据。

相关出版物

Y.C. Lin, W.Y. Kuo, and S.W. Wang, “Cloud Sudoku: A Sudoku Application to Collect Game Records by Human Players,” in IEEE International Conference On Consumer Electronics - Taiwan (IEEE ICCE-TW 2024), Taichung, Taiwan, July 9-11, 2024.

搜集汇总

数据集介绍

构建方式

在构建该数独谜题数据集时，研究者首先开发了一款名为Cloud Sudoku的Android应用程序，用于收集人类玩家的游戏记录。通过对玩家在解决数独谜题时所花费的时间以及成功解决的比例进行分析，提出了两种难度指标：$D_{TO}$，仅考虑解决时间；$D_{TR}$，同时考虑解决时间和完成率。这些指标为每道数独谜题提供了基于人类体验的难度评估，从而构建了一个包含难度指标的数独谜题数据集。

特点

该数据集的显著特点在于其基于人类玩家的真实游戏体验，提供了两种独特的难度指标，分别为$D_{TO}$和$D_{TR}$。这些指标不仅反映了玩家在解决数独谜题时的时间消耗，还考虑了谜题的完成率，使得数据集在评估数独难度算法时具有更高的准确性和实用性。此外，数据集的构建方式确保了其与人类玩家行为的紧密关联，避免了传统数据集中可能存在的算法偏差问题。

使用方法

该数据集主要用于评估和改进数独谜题难度评级算法。研究者可以通过分析数据集中每道谜题的难度指标，如$D_{TO}$和$D_{TR}$，来验证和优化现有的难度评级模型。此外，数据集还可用于开发新的算法，以更精确地预测和分类数独谜题的难度级别。通过使用该数据集，研究者能够确保其算法在实际应用中具有更高的可靠性和准确性。

背景与挑战

背景概述

数独作为一种全球流行的益智游戏，其难度评估一直是学术界关注的焦点。传统的难度评估算法往往依赖于非人类玩家的数据集，导致算法之间的比较和改进受到限制。为了解决这一问题，Sheng-Wei Wang及其团队于2024年开发了名为Cloud Sudoku的Android应用程序，用于收集人类玩家在解决数独谜题时的数据。基于玩家解决谜题的时间和成功率，团队提出了两种难度指标：$D_{TO}$（仅考虑解决时间）和$D_{TR}$（同时考虑解决时间和完成率）。该数据集的构建不仅填补了现有研究的空白，还为数独难度评估算法的研究提供了新的基准。

当前挑战

该数据集面临的挑战主要集中在两个方面。首先，如何准确评估数独谜题的难度是一个复杂的问题，因为不同玩家的经验和策略差异可能导致数据集中的难度指标存在偏差。其次，构建过程中，如何确保数据的真实性和一致性也是一个重要挑战。由于数据来源于人类玩家，可能存在个体差异和偶然性，这使得难度评估算法的泛化能力受到限制。此外，如何设计有效的算法来利用这些难度指标进行性能评估，也是该数据集未来研究中需要解决的关键问题。

常用场景

经典使用场景

该数据集的经典使用场景主要集中在数独谜题难度评估算法的开发与验证。通过提供基于人类玩家实际游戏体验的难度指标，研究者能够设计并测试新的难度评估模型，从而提升数独谜题生成与分类的准确性。

衍生相关工作

基于该数据集，研究者已开展了一系列相关工作，包括开发新的数独谜题生成算法、优化现有难度评估模型，以及探索数独谜题在不同领域的应用。例如，Dhananjaya等人利用该数据集设计了一款适用于Android设备的2D谜题生成器，进一步拓展了数独谜题的应用场景。

数据集最近研究