dclure/laion-aesthetics-12m-umap

Name: dclure/laion-aesthetics-12m-umap
Creator: dclure
Published: 2022-09-12 21:45:15
License: 暂无描述

Hugging Face2022-09-12 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/dclure/laion-aesthetics-12m-umap

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是LAION-Aesthetics数据集的CLIP文本到UMAP嵌入的转换结果，基于`improved_aesthetics_6plus`版本，该版本通过美学评分模型筛选出评分大于6的图像。数据集包含了使用不同`n_neighbors`参数值（10、30和60）生成的三个独立的UMAP拟合坐标，分别以不同的列名表示。生成该数据集的Python脚本包括使用CLIP模型进行文本嵌入、使用随机投影将嵌入矩阵压缩到64维，以及使用UMAP将64维嵌入降维到2维的过程。

This dataset is the conversion from CLIP text embeddings to UMAP embeddings derived from the LAION-Aesthetics dataset, specifically based on the `improved_aesthetics_6plus` variant. This variant filters out images with aesthetic scores greater than 6 using an aesthetic scoring model. The dataset contains three independent sets of UMAP-fitted coordinates generated with distinct `n_neighbors` parameter values (10, 30, and 60), each denoted by a unique column name. The Python script for generating this dataset includes three core procedures: generating text embeddings via the CLIP model, compressing the embedding matrix to 64 dimensions via random projection, and reducing the 64-dimensional embeddings to 2 dimensions using UMAP.

提供机构：

dclure

原始信息汇总

数据集概述

基本信息

数据集名称: laion-aesthetics-12m-umap
语言: 英语
语言创建者: 发现
许可证: MIT
多语言性: 单语
标签: laion, stable-diffuson, text2img

数据集描述

该数据集是基于LAION-Aesthetics数据集的CLIP（文本）→ UMAP嵌入，特别是improved_aesthetics_6plus版本，该版本过滤了完整数据集，仅包含在“美学”过滤模型下得分大于6的图像。

数据结构

数据集包含3种不同n_neighbors参数值（10, 30, 60）的UMAP拟合坐标，分别对应以下列：

n_neighbors=10 → (x_nn10, y_nn10)
n_neighbors=30 → (x_nn30, y_nn30)
n_neighbors=60 → (x_nn60, y_nn60)

数据处理流程

使用openai/clip-vit-base-patch32模型对文本描述进行编码。
使用cuml.GaussianRandomProjection将嵌入矩阵压缩到64维。
使用cuml.UMAP将64维嵌入矩阵降维到2维。

搜集汇总

数据集介绍

构建方式

LAION-Aesthetics :: CLIP → UMAP数据集的构建是基于LAION-Aesthetics数据集的改进版本'improved_aesthetics_6plus'，该数据集通过CLIP模型将文本描述转化为视觉嵌入，随后利用UMAP降维技术将高维嵌入映射至二维空间。此过程中，通过调整'n_neighbors'参数值（分别为10、30和60），生成不同的UMAP拟合结果，并以不同列的形式呈现。

使用方法

用户可通过对数据集进行加载，直接获取文本描述对应的二维视觉嵌入坐标。这些坐标可用于进一步的数据分析，如图像美学质量的评估、可视化探索等。用户可根据不同的'n_neighbors'参数选择相应的嵌入坐标，以适应不同的研究需求。

背景与挑战

背景概述

LAION-Aesthetics数据集是在机器学习与艺术审美领域交叉研究背景下产生的成果，由LAION团队于近期创建。该数据集的构建旨在探索图像的审美价值与文本描述之间的关系，通过CLIP模型将文本描述与UMAP降维技术相结合，对LAION-Aesthetics原始数据集中的高评分图像进行嵌入表示。其研究成果对于图像处理、自然语言处理以及艺术审美领域均具有重要价值，推动了相关领域的技术进步与理论发展。

当前挑战

该数据集在构建过程中主要面临以下挑战：首先，如何精确地筛选出具有高审美价值的图像，确保数据集的质量与相关性；其次，如何有效地将文本描述与图像内容进行对应，以实现准确的嵌入表示；最后，在数据降维过程中，如何保持数据的原有结构特征，避免信息的丢失。这些挑战不仅涉及到数据处理与模型选择的技术问题，也涉及到对审美标准与艺术价值的深入理解与把握。

常用场景

经典使用场景

在人工智能研究领域，dclure/laion-aesthetics-12m-umap数据集被广泛用于图像美学评估。该数据集将LAION-Aesthetics图像库通过CLIP模型转换为UMAP嵌入，实现了图像美学特征向量的二维映射。这为研究者提供了一种直观的方式来探索和可视化图像的美学属性。

解决学术问题

该数据集解决了图像美学评价中主观性过强的问题，通过客观的算法模型将图像的审美特征量化，有助于推进图像美学领域的定量化研究。此外，它还促进了图像特征提取和降维技术的应用，为图像美学分类和相似度度量提供了可靠的数据基础。

实际应用

在实际应用中，dclure/laion-aesthetics-12m-umap数据集可用于图像检索系统、推荐算法以及图像内容审核等领域，通过分析图像的美学特征，提升系统的智能化水平和用户体验。

数据集最近研究