human_annotation_creativity

Hugging Face2026-03-28 更新2026-03-29 收录

下载链接：

https://huggingface.co/datasets/connections-dev/human_annotation_creativity

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含235个训练样本，主要用于路径规划或决策支持相关任务。数据结构包含五个核心字段：1) 'query'（字符串类型，表示查询内容）2) 'paths_0_filtered'（三级嵌套的字符串列表，存储路径信息）3) 'utility_scores_0'（浮点数值，表示路径效用评分）4) 'model'（字符串，标识生成模型）5) 'formatted_paths'（字符串，格式化路径表示）。数据集总大小为1.47MB，下载压缩包为340KB，仅包含训练集划分。适用于路径优化、决策评估等机器学习任务。

创建时间：

2026-03-28

原始信息汇总

数据集概述

基本信息

数据集名称: human_annotation_creativity
发布者: connections-dev
平台: Hugging Face Datasets
详情页面地址: https://huggingface.co/datasets/connections-dev/human_annotation_creativity

数据集结构与内容

数据格式: 包含多个字段的结构化数据。
特征（Features）:
- query: 字符串类型，代表查询内容。
- paths_0_filtered: 嵌套列表结构，其内部为字符串列表的列表。
- utility_scores_0: 浮点数类型（float64），代表效用分数。
- model: 字符串类型，代表模型信息。
- formatted_paths: 字符串类型，代表格式化后的路径信息。
数据划分:
- 仅包含一个划分：train（训练集）。
- 训练集样本数量：235。
- 训练集数据大小：868,303 字节。

数据集存储信息

下载大小: 191,440 字节。
数据集总大小: 868,303 字节。
默认配置: default。
- 数据文件路径模式：data/train-*。

搜集汇总

数据集介绍

构建方式

在创造力评估领域，human_annotation_creativity数据集通过精心设计的人工标注流程构建而成。该数据集收集了来自不同模型的创意生成路径，并邀请人类评估者对每条路径的效用进行评分，从而形成结构化记录。构建过程注重路径的多样性和评分的客观性，确保数据能真实反映人类对创意质量的判断，为后续研究提供了可靠基础。

特点

该数据集的核心特点在于其多维度的创意路径表示和精细的人工评分体系。每条数据不仅包含原始查询和模型生成的创意路径，还提供了经过过滤的路径序列及对应的效用分数，便于深入分析创意生成过程。数据集规模适中，涵盖多种模型输出，结构清晰，支持对创意评估的量化研究，具有较高的实用价值。

使用方法

使用human_annotation_creativity数据集时，研究者可首先加载训练分割数据，通过查询字段和创意路径进行创意生成分析。效用分数可用于训练或评估创意评估模型，而过滤后的路径序列则有助于理解创意结构的演变。数据集适用于自然语言处理和创造力计算任务，建议结合具体研究目标进行预处理和模型集成。

背景与挑战

背景概述

在人工智能与认知科学交叉领域，创造力评估一直是核心研究议题。human_annotation_creativity数据集应运而生，旨在系统化探索人类对创造性思维过程的标注机制。该数据集由相关研究团队构建，聚焦于解析创造性任务中人类评判者如何对多路径解决方案进行效用评分，从而为计算创造力模型提供精细化的人类反馈基准。其创建深化了我们对创造力量化表征的理解，推动了基于人类标注的生成式人工智能评估方法的发展，在自然语言处理与创造性计算领域具有重要影响力。

当前挑战

该数据集致力于解决创造性任务中解决方案的效用评估问题，其核心挑战在于如何定义并量化“创造性”这一主观且多维的概念，确保标注的一致性与可靠性。在构建过程中，挑战主要体现为设计能够激发多样化创造性路径的任务查询，以及建立标准化流程来收集和处理人类对复杂、非结构化解决方案路径的效用评分，同时需克服标注者主观差异带来的噪声，保证数据质量与泛化能力。

常用场景

经典使用场景

在创意生成与评估领域，human_annotation_creativity数据集为研究模型创造性思维提供了关键基准。该数据集通过收集人类标注的创意路径与效用评分，典型应用于训练和验证生成模型在多样化查询下的创意输出能力。研究者利用其结构化路径和评分数据，系统分析模型生成内容的创新性、多样性与实用性，从而推动创意计算的前沿探索。

衍生相关工作

基于该数据集，衍生了一系列关于创意评估与生成的研究工作。例如，有研究利用其标注路径探索多模态创意生成模型，将文本与视觉创意相结合；另有工作专注于开发自动化创意评分算法，以减少对人类标注的依赖。这些经典工作不仅拓展了创意计算的理论框架，还促进了更高效、可扩展的创意系统在实际场景中的部署与应用。

数据集最近研究