five

ungenerated

收藏
Hugging Face2026-04-18 更新2026-04-19 收录
下载链接:
https://huggingface.co/datasets/Thereallo/ungenerated
下载链接
链接失效反馈
官方服务:
资源简介:
Ungenerated 数据集包含从 ungenerated.io 收集的重建 PNG 艺术作品及相关元数据。数据集涵盖用户标注的艺术风格,如数字艺术、传统艺术、3D 艺术、像素艺术、摄影等。每个样本包含以下字段:图像(重建的 PNG 格式)、唯一作品 ID、艺术家给定的标题、艺术家描述、自报的艺术风格、图像高度(像素)、图像宽度(像素)、艺术家用户名、艺术家用户 ID 以及 ISO 8601 格式的创建时间戳。数据集适用于图像分类和文本到图像生成任务,主要用于教育和研究目的。所有图像和元数据均为原始创作者的知识产权,数据集编译者不主张任何版权。

The Ungenerated Dataset contains reconstructed PNG artworks and associated metadata collected from ungenerated.io. The dataset covers user-annotated art styles including digital art, traditional art, 3D art, pixel art, photography and others. Each sample includes the following fields: reconstructed PNG-format image, unique work ID, title given by the artist, artist's description, self-reported art style, image height (in pixels), image width (in pixels), artist username, artist user ID, and creation timestamp in ISO 8601 format. The dataset is applicable to image classification and text-to-image generation tasks, and is primarily used for educational and research purposes. All images and metadata are the intellectual property of their original creators, and the dataset compiler does not claim any copyrights.
创建时间:
2026-04-15
原始信息汇总

Ungenerated 数据集概述

数据集详情

该数据集包含从 ungenerated.io 收集的重建PNG艺术作品及相关元数据。

艺术风格

示例包含用户标注的风格,例如数字艺术、传统艺术、3D艺术、像素艺术、摄影以及源平台中存在的其他类别。

数据模式

每个示例包含以下列:

列名 类型 描述
image Image 重建的PNG图像
id string 唯一的艺术品ID
title string 艺术家给定的标题
description string 艺术家的描述
artStyle string 自我报告的艺术风格
imageHeight int 图像高度(像素)
imageWidth int 图像宽度(像素)
username string 艺术家的用户名
userId string 艺术家的用户ID
createdAt string ISO 8601 创建时间戳

使用方式

python from datasets import load_dataset ds = load_dataset("Thereallo/ungenerated", split="train")

注意事项

  • 由于服务器错误导致重建失败的图像已被排除。

版权与免责声明

数据集中的所有图像和元数据均为其在 ungenerated.io 上的各自创作者的知识产权。本数据集的汇编者不对其中任何内容提出版权主张

本数据集仅用于教育和研究目的。汇编者不对本数据集或其内容的任何使用、滥用或重新分发负责。使用本数据集即表示您同意,确保您的使用符合所有适用法律及原始艺术家的权利是您的唯一责任。

搜集汇总
数据集介绍
main_image_url
构建方式
在数字艺术领域,Ungenerated数据集通过系统化采集ungenerated.io平台上的用户原创艺术作品构建而成。该过程涉及对平台公开的艺术作品进行重构,将原始图像转换为PNG格式,并提取与之关联的元数据,如作品标题、艺术家描述及自报告的艺术风格。为确保数据完整性,构建过程中排除了因服务器错误导致重构失败的图像,从而保证了数据集在视觉与文本维度上的高质量对齐。
使用方法
研究人员可通过Hugging Face的datasets库直接加载Ungenerated数据集,使用标准接口访问图像与元数据字段。该数据集适用于图像分类、文本到图像生成等机器学习任务,也可用于艺术风格演化、创作者行为模式等跨学科研究。使用者需严格遵守仅限教育与研究用途的版权声明,确保在合规范围内开展数据探索与分析工作。
背景与挑战
背景概述
Ungenerated数据集于当代数字艺术与人工智能生成内容交织的背景下应运而生,其核心研究问题聚焦于探索纯粹人类创作的艺术作品在风格、主题与表达上的独特性,旨在为图像分类与文本到图像生成等任务提供一个反AI生成内容的基准参考。该数据集由社区驱动,通过收集并重构ungenerated.io平台上的PNG格式艺术作品及相关元数据而构建,涵盖了数字艺术、传统艺术、三维艺术、像素艺术及摄影等多种用户标注的艺术风格。它不仅为艺术风格识别与分类研究提供了宝贵资源,更在人工智能伦理与创作真实性讨论中扮演了重要角色,推动了关于人类创造力与机器辅助创作界限的学术对话。
当前挑战
Ungenerated数据集所解决的领域问题在于艺术风格分类与人类创作识别,其挑战在于如何准确区分复杂多变的艺术风格,并建立可靠的模型以辨识纯粹人类作品与AI生成内容之间的细微差异。在构建过程中,数据集面临多重挑战:首先,艺术风格标签依赖于用户自我报告,可能存在主观性与不一致性,影响分类精度;其次,图像重构过程受服务器错误限制,导致部分数据缺失,可能引入偏差;此外,数据集承载着平台反AI言论与工程实践的双重标准矛盾,这要求研究者在伦理与法律框架下谨慎使用数据,确保尊重原艺术家版权与创作意图,同时应对数据采集中的技术限制与道德争议。
常用场景
经典使用场景
在数字艺术与计算机视觉领域,Ungenerated数据集常被用于图像分类与风格识别任务。该数据集汇集了来自ungenerated.io平台的人类创作艺术作品,涵盖数字艺术、传统艺术、三维艺术等多种自报告艺术风格,为研究者提供了丰富的视觉素材。通过分析图像与其元数据,如标题、描述和艺术风格标签,该数据集支持构建和评估艺术风格分类模型,有助于深入理解人类艺术表达的多样性与特征。
解决学术问题
Ungenerated数据集主要解决了艺术图像自动分类与风格分析中的学术挑战。在艺术信息学与视觉计算研究中,准确识别和归类艺术风格是核心问题之一。该数据集通过提供大量带有人类标注风格的艺术作品,使得机器学习模型能够学习艺术风格的细微差异,从而推动艺术风格迁移、内容生成以及艺术史数字化分析等领域的发展。其意义在于为艺术与人工智能的交叉研究提供了可靠的数据基础,促进了创造性计算方法的创新。
实际应用
在实际应用中,Ungenerated数据集可用于艺术教育、数字内容管理和创意产业工具开发。例如,艺术教育平台可以利用该数据集训练风格识别系统,辅助学生或爱好者学习不同艺术流派的特点;数字画廊或博物馆则可借助其元数据优化艺术作品的分类与检索系统,提升用户体验。此外,该数据集还能支持创意软件中的风格推荐功能,帮助艺术家寻找灵感或进行作品风格分析,从而增强艺术创作的效率与多样性。
数据集最近研究
最新研究方向
在数字艺术与生成式人工智能交融的背景下,Ungenerated数据集为探索人类创作与算法生成之间的边界提供了独特资源。当前研究聚焦于利用该数据集中的用户标注艺术风格与元数据,训练细粒度的图像分类模型,以区分传统数字艺术、像素艺术等多样风格,进而支持艺术风格迁移与创意辅助系统的开发。同时,数据集所蕴含的平台反AI修辞矛盾,激发了关于艺术创作真实性、知识产权伦理及人机协作范式的学术讨论,推动跨学科研究审视技术标准与人文价值的互动关系。这些方向不仅深化了对创造性表达的理解,也为构建更公平、透明的数字艺术生态系统提供了实证基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作