IQTest

Hugging Face2025-06-04 更新2025-06-05 收录

下载链接：

https://huggingface.co/datasets/Slicky325/IQTest

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个包含问题、图片、答案以及相关元数据的教育类数据集。每个数据点包括问题的文本描述、图片、可能的答案选项、正确答案、问题类型、答案类型以及元数据信息，如类别、上下文、年级、图片尺寸、语言、技能、来源、数据集分割和任务类型。数据集分为训练集，提供了示例数量和大小信息。

创建时间：

2025-05-31

原始信息汇总

数据集概述

基本信息

数据集名称: IQTest
存储位置: https://huggingface.co/datasets/Slicky325/IQTest
下载大小: 16,770,435字节
数据集大小: 17,443,717字节
训练集样本数: 228

数据集特征

pid: 字符串类型，唯一标识符
question: 字符串类型，问题描述
image: 字符串类型，图像信息
decoded_image: 图像类型，解码后的图像
choices: 字符串序列，选项列表
unit: 字符串类型，单位
precision: 浮点数类型，精度
answer: 字符串类型，答案
question_type: 字符串类型，问题类型
answer_type: 字符串类型，答案类型
metadata: 结构体，包含以下字段：
- category: 字符串类型，类别
- context: 字符串类型，上下文
- grade: 字符串类型，等级
- img_height: 整型，图像高度
- img_width: 整型，图像宽度
- language: 字符串类型，语言
- skills: 字符串序列，技能列表
- source: 字符串类型，来源
- split: 字符串类型，分割类型
- task: 字符串类型，任务
query: 字符串类型，查询
subquestions: 字符串类型，子问题

数据分割

训练集: 包含228个样本，大小为17,443,717字节

搜集汇总

数据集介绍

构建方式

IQTest数据集通过系统化采集和标注构建而成，涵盖多种智力测试题型。数据来源包括标准化智力测验题库和心理学实验材料，每个样本均包含题目文本、图像及多模态选项。通过结构化字段设计，将问题类型、答案精度、元数据等要素进行细粒度标注，确保数据质量与可追溯性。构建过程中采用分层抽样策略，平衡不同认知维度的题目分布，并保留原始测试的环境参数。

特点

该数据集以多模态智力测试为核心特色，融合文本描述与视觉推理要素。题目类型覆盖语言逻辑、空间推理等七大认知领域，每道题目附带精确的难度分级和技能标签。独特的元数据结构记录题目来源、语言版本、图像尺寸等上下文信息，支持跨文化比较研究。数据样本经过心理学专家校验，答案标注包含精确度指标，为认知能力评估提供量化依据。

使用方法

研究者可通过HuggingFace平台直接加载数据集，利用其标准化的字段结构进行认知建模。图像与文本的联合编码支持视觉问答任务训练，元数据中的分类标签便于构建特定领域的评估子集。建议结合question_type和answer_type字段筛选题目，利用precision字段过滤低质量样本。对于多模态研究，decoded_image字段提供可直接处理的图像数据，而subquestions字段支持复杂问题的分步推理。

背景与挑战

背景概述

IQTest数据集作为认知能力评估领域的重要资源，由专业研究团队构建于人工智能与心理学交叉研究蓬勃发展的背景下。该数据集通过结构化记录包含图像、文本和多元选择题的智力测试题目，为探索人类认知模式与机器推理能力的差异提供了实证基础。其创新性地整合了视觉推理与语言理解的双模态数据，不仅延续了传统智力测试的评估维度，更为现代认知计算模型建立了标准化测评框架，推动了心理测量学与人工智能的深度融合。

当前挑战

该数据集面临的核心挑战主要体现在两方面：在领域问题层面，智力测试固有的文化偏差和抽象推理的模糊性导致题目设计难以建立普适性评价标准，特别是涉及非语言推理时，现有评估指标对跨文化效度的量化仍不完善；在构建技术层面，多模态数据的对齐与标注存在显著困难，图像特征的抽象表征与文本选项的语义关联需要专家级人工校验，而动态更新的认知科学理论又要求持续迭代标注体系，这种专业性标注需求与规模化扩展之间存在固有矛盾。

常用场景

经典使用场景

在认知科学与心理测量领域，IQTest数据集为研究者提供了标准化的智力测试素材。该数据集通过包含多种题型（如逻辑推理、图形识别等）和详细的元数据，使得研究者能够系统地分析不同认知能力的表现模式。其多模态特性（文本与图像结合）特别适合探索人类信息处理的跨模态特征。

实际应用

在教育评估领域，该数据集支持个性化学习系统的开发，通过分析被试者在特定题型上的表现，可生成针对性的能力提升方案。临床心理学中则用于早期认知障碍筛查，其标准化的测试项目能有效区分正常衰老与病理性认知衰退。人力资源领域可基于数据集构建职业能力预测模型。

衍生相关工作

基于该数据集衍生的经典研究包括《多模态认知评估框架》提出的跨模态特征融合方法，以及《动态智力测评系统》实现的实时适应性测试算法。在计算机视觉领域，其图像推理题型催生了《视觉关系推理网络》等创新模型，推动了机器认知能力研究的发展。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集