five

nonograms数据集

收藏
arXiv2025-01-10 更新2025-01-14 收录
下载链接:
https://github.com/josebambu/NonoDataset
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集由巴利阿里群岛大学的研究团队创建,旨在为神经网络训练提供nonograms(一种逻辑谜题)的公开数据。nonograms是一种基于网格的逻辑谜题,玩家需根据行列的提示数字填充或留空单元格,最终形成一幅二进制图像。数据集的内容包括不同大小的nonograms谜题,具体数据量和Tokens数未明确提及。数据集的创建过程涉及生成不同难度的nonograms谜题,并通过算法验证其有效性。该数据集的应用领域主要集中在人工智能和逻辑推理领域,旨在通过结合启发式算法和神经网络,提高解决nonograms谜题的效率和准确性。

This dataset was created by a research team from the University of the Balearic Islands, aiming to provide publicly available nonograms data for neural network training. Nonograms are grid-based logic puzzles wherein players fill or leave cells blank based on the hint numbers specified for rows and columns, ultimately forming a binary image. The dataset contains nonogram puzzles of varying sizes, while the specific data volume and number of tokens are not explicitly mentioned. The dataset creation process involves generating nonogram puzzles with different difficulty levels and verifying their validity via algorithms. Its main application fields focus on artificial intelligence and logical reasoning, aiming to improve the efficiency and accuracy of solving nonogram puzzles by combining heuristic algorithms and neural networks.
提供机构:
巴利阿里群岛大学计算机图形与视觉及人工智能研究组(UGiVIA),健康科学研究所(IUNICS),数学与信息学系
创建时间:
2025-01-10
搜集汇总
数据集介绍
main_image_url
构建方式
nonograms数据集的构建过程主要基于生成和转换逻辑。首先,对于5×5大小的棋盘,生成了所有可能的棋盘组合,共计约3.36e07个。对于10×10和15×15大小的棋盘,由于组合数量过于庞大,采用了从MAME Icons和Icons50数据集中提取图像,并通过Canny边缘检测、二值化阈值、Otsu阈值及其反转等图像处理技术生成初始nonogram。此外,还通过随机噪声和简单几何图形的绘制生成了额外的随机nonogram,最终形成了一个包含33,554,432个5×5棋盘、376,368个10×10棋盘和676,368个15×15棋盘的多样化数据集。
特点
nonograms数据集的特点在于其多样性和复杂性。数据集涵盖了从5×5到15×15不同大小的棋盘,且每个棋盘都有其独特的解。通过图像处理和随机生成技术,数据集不仅包含了从真实图像转换而来的nonogram,还包含了大量随机生成的nonogram,确保了数据集的广泛性和代表性。此外,数据集的构建还考虑了棋盘编码的复杂性,通过反射和编码空间的优化,进一步提升了数据集的可用性和挑战性。
使用方法
nonograms数据集的主要用途是训练和测试神经网络及其他算法来解决nonogram逻辑谜题。数据集中的每个棋盘都附有相应的解,可用于监督学习。研究人员可以通过该数据集评估不同算法在解决nonogram时的性能,尤其是结合启发式算法、深度优先搜索(DFS)、遗传算法(GA)和神经网络的混合方法。数据集还可用于研究棋盘编码的优化、反射技术的应用以及神经网络在逻辑谜题中的表现。
背景与挑战
背景概述
Nonograms数据集由José María Buades Rubio等人于2025年创建,旨在通过结合启发式算法与神经网络来解决Nonogram逻辑谜题。Nonogram是一种源自日本的逻辑谜题,玩家需根据行列的提示数字填充或留空网格中的单元格,最终形成一幅二进制图像。该数据集的核心研究问题是如何利用神经网络提升传统算法(如深度优先搜索和遗传算法)在解决Nonogram谜题时的效率。研究团队首次将神经网络引入Nonogram求解领域,并通过生成公开数据集来训练神经网络模型。这一工作填补了该领域的研究空白,并为后续的Nonogram求解算法提供了新的思路和工具。
当前挑战
Nonograms数据集面临的挑战主要体现在两个方面。首先,Nonogram谜题本身属于NP完全问题,求解过程无法在多项式时间内完成,且某些谜题存在多个解,增加了求解的复杂性。其次,在数据集构建过程中,研究人员需要生成大量不同尺寸的Nonogram谜题及其解,尤其是对于较大的网格(如10×10和15×15),由于可能的组合数量极其庞大,生成所有可能的谜题几乎不可行。为此,研究团队采用了从图像生成谜题的策略,并结合随机生成方法,确保了数据集的多样性和规模。此外,神经网络的训练也面临挑战,尤其是如何设计网络结构以有效处理不同尺寸的Nonogram谜题,并确保其在求解过程中的泛化能力。
常用场景
经典使用场景
nonograms数据集在逻辑谜题求解领域具有广泛的应用,尤其是在结合启发式算法和神经网络的研究中。该数据集通过提供不同尺寸的非数独谜题及其解决方案,为训练和测试神经网络提供了丰富的素材。经典的使用场景包括利用神经网络预测非数独谜题的解决方案,并通过启发式算法进一步优化求解过程。这种结合不仅提高了求解效率,还为复杂谜题的自动化求解提供了新的思路。
解决学术问题
nonograms数据集解决了非数独谜题求解中的多个学术问题,尤其是在NP完全问题的求解效率上。通过结合启发式算法和神经网络,该数据集显著提升了求解速度,并减少了计算资源的消耗。此外,该数据集还为研究神经网络在逻辑推理中的应用提供了实验基础,填补了此前神经网络在非数独求解领域的空白。其意义在于为复杂逻辑问题的自动化求解提供了新的方法论,推动了人工智能在逻辑推理领域的发展。
衍生相关工作
nonograms数据集衍生了许多相关经典工作,尤其是在启发式算法与神经网络的结合方面。例如,基于该数据集的研究提出了结合深度优先搜索(DFS)和神经网络的混合算法,显著提升了非数独谜题的求解效率。此外,该数据集还推动了遗传算法(GA)在非数独求解中的应用研究,尽管其效果不如启发式算法显著。这些衍生工作不仅扩展了非数独求解的研究范围,还为其他逻辑谜题的自动化求解提供了参考。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作