HuggingFaceM4/PGM

Name: HuggingFaceM4/PGM
Creator: HuggingFaceM4
Published: 2024-02-15 07:07:47
License: 暂无描述

Hugging Face2024-02-15 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/HuggingFaceM4/PGM

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集名为PGM，用于论文《Measuring abstract reasoning in neural networks》。数据集包含训练集、验证集和测试集，每个集都有对应的文件路径和大小。数据集的特征包括图像面板、选择项、编码的关系结构、关系结构、元目标、目标和ID。

提供机构：

HuggingFaceM4

原始信息汇总

数据集概述

数据集配置

配置名称: default
- 数据文件:
  - 训练集: data/train-*
  - 验证集: data/validation-*
  - 测试集: data/test-*

数据集信息

特征:
- panels: 图像列表
- choices: 图像列表
- relation_structure_encoded: 二维数组，形状为 (4, 12)，数据类型为 uint8
- relation_structure: 二维数组，形状为 (1, 3)，数据类型为 string
- meta_target: 二维数组，形状为 (1, 12)，数据类型为 uint8
- target: 数据类型为 uint8
- id: 数据类型为 int32

数据集分割

训练集:
- 字节数: 26850203831.0
- 样本数: 1200000
验证集:
- 字节数: 602510542.0
- 样本数: 20000
测试集:
- 字节数: 4475789847.0
- 样本数: 200000

数据集大小

下载大小: 44244925294
数据集大小: 31928504220.0

搜集汇总

数据集介绍

构建方式

在抽象推理研究领域，PGM数据集的构建遵循了严谨的生成范式。该数据集源自同名研究论文，旨在系统化地评估神经网络的抽象推理能力。其核心构建方式依赖于程序化生成机制，通过预定义的关系结构与规则，自动合成海量的视觉推理问题。每个样本均包含一组具有内在逻辑关联的面板图像、多个候选答案图像，以及编码化的关系描述与目标标签。数据被划分为训练集、验证集与测试集，确保了模型评估的可靠性与泛化性。

特点

PGM数据集在视觉推理领域展现出鲜明的结构性特征。其样本以图像序列形式呈现，每个问题包含多个输入面板和一组候选选择，要求模型识别并延续其中隐含的抽象关系。数据集不仅提供了原始的视觉信息，还附带了关系结构的符号化编码与元目标信息，为多模态与符号化推理研究提供了丰富的监督信号。数据规模庞大，涵盖超过百万训练样本，且问题类型集中于中性配置，专注于考察纯粹的抽象模式识别与归纳能力。

使用方法

使用PGM数据集时，研究者通常将其作为评估抽象推理能力的基准工具。数据集已按标准划分为训练、验证与测试部分，可直接用于模型的训练与性能评测。典型的使用流程涉及加载图像面板与候选选项，结合提供的关系结构编码或元数据，构建输入-输出对。模型需要从上下文面板中推断出抽象规则，并从候选图像中选出符合逻辑延续的目标。该数据集支持端到端的视觉推理任务，亦可用于研究符号知识与视觉感知的结合方式。

背景与挑战

背景概述

在人工智能领域，抽象推理能力被视为衡量智能系统认知水平的关键指标。PGM数据集由HuggingFaceM4团队于2018年创建，旨在为论文《测量神经网络中的抽象推理》提供评估基准。该数据集聚焦于解决视觉抽象推理的核心研究问题，通过模拟人类在瑞文渐进矩阵测试中的认知过程，挑战神经网络对隐含规则和逻辑关系的理解能力。其构建不仅推动了机器学习模型在非监督推理任务上的发展，也为认知计算领域提供了重要的实验平台，促进了跨模态智能研究的深入。

当前挑战

PGM数据集所针对的视觉抽象推理问题，其挑战在于模型需从有限的视觉面板中推断出复杂的隐含关系，并泛化至未见过的组合场景，这对传统深度学习的模式识别能力提出了更高要求。在构建过程中，研究人员面临生成多样化且符合逻辑的矩阵结构的难题，需确保数据既能覆盖广泛的推理模式，又避免引入人为偏差。此外，编码关系结构时平衡语义丰富性与计算效率，以及大规模数据标注的准确性控制，均是数据集开发中的关键障碍。

常用场景

经典使用场景

在抽象推理与视觉认知研究领域，PGM数据集作为一项基准工具，主要用于评估神经网络模型在解决瑞文渐进矩阵问题上的能力。该数据集通过呈现一系列视觉图案序列，要求模型从多个候选答案中选出符合逻辑规律的选项，从而模拟人类的高级抽象推理过程。经典使用场景涉及模型训练与验证，研究者利用其丰富的图像面板和结构化关系编码，测试模型在归纳、演绎及类比推理任务中的表现，为认知计算和人工智能的通用推理能力提供量化依据。

解决学术问题

PGM数据集的核心价值在于它系统性地解决了机器学习中抽象推理能力量化评估的难题。传统模型往往局限于模式识别，而该数据集通过引入复杂的视觉关系结构，促使研究聚焦于模型如何从有限示例中推断隐含规则，进而探索神经网络的可解释性与泛化性能。这一突破不仅推动了认知科学与人工智能的交叉研究，还为构建具备人类式推理能力的智能系统奠定了实证基础，对推进通用人工智能的发展具有深远意义。

衍生相关工作

围绕PGM数据集，学术界衍生出一系列经典研究工作。例如，原始论文《Measuring abstract reasoning in neural networks》开创了神经网络抽象推理的评估范式；后续研究如《Relational neural expectation maximization》利用其关系结构探索符号与神经结合的推理模型；而《Abstract Diagrammatic Reasoning with Multiplex Graph Networks》则进一步扩展了图网络在矩阵问题中的应用。这些工作共同深化了对机器学习中推理机制的理解，并催生了多模态推理与可解释AI的新方向。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集