five

dclure/laion-aesthetics-12m-umap

收藏
Hugging Face2022-09-12 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/dclure/laion-aesthetics-12m-umap
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是LAION-Aesthetics数据集的CLIP文本到UMAP嵌入的转换结果,基于`improved_aesthetics_6plus`版本,该版本通过美学评分模型筛选出评分大于6的图像。数据集包含了使用不同`n_neighbors`参数值(10、30和60)生成的三个独立的UMAP拟合坐标,分别以不同的列名表示。生成该数据集的Python脚本包括使用CLIP模型进行文本嵌入、使用随机投影将嵌入矩阵压缩到64维,以及使用UMAP将64维嵌入降维到2维的过程。

This dataset is the conversion from CLIP text embeddings to UMAP embeddings derived from the LAION-Aesthetics dataset, specifically based on the `improved_aesthetics_6plus` variant. This variant filters out images with aesthetic scores greater than 6 using an aesthetic scoring model. The dataset contains three independent sets of UMAP-fitted coordinates generated with distinct `n_neighbors` parameter values (10, 30, and 60), each denoted by a unique column name. The Python script for generating this dataset includes three core procedures: generating text embeddings via the CLIP model, compressing the embedding matrix to 64 dimensions via random projection, and reducing the 64-dimensional embeddings to 2 dimensions using UMAP.
提供机构:
dclure
原始信息汇总

数据集概述

基本信息

  • 数据集名称: laion-aesthetics-12m-umap
  • 语言: 英语
  • 语言创建者: 发现
  • 许可证: MIT
  • 多语言性: 单语
  • 标签: laion, stable-diffuson, text2img

数据集描述

该数据集是基于LAION-Aesthetics数据集的CLIP(文本)→ UMAP嵌入,特别是improved_aesthetics_6plus版本,该版本过滤了完整数据集,仅包含在“美学”过滤模型下得分大于6的图像。

数据结构

数据集包含3种不同n_neighbors参数值(10, 30, 60)的UMAP拟合坐标,分别对应以下列:

  • n_neighbors=10 → (x_nn10, y_nn10)
  • n_neighbors=30 → (x_nn30, y_nn30)
  • n_neighbors=60 → (x_nn60, y_nn60)

数据处理流程

  1. 使用openai/clip-vit-base-patch32模型对文本描述进行编码。
  2. 使用cuml.GaussianRandomProjection将嵌入矩阵压缩到64维。
  3. 使用cuml.UMAP将64维嵌入矩阵降维到2维。
搜集汇总
数据集介绍
main_image_url
构建方式
LAION-Aesthetics :: CLIP → UMAP数据集的构建是基于LAION-Aesthetics数据集的改进版本'improved_aesthetics_6plus',该数据集通过CLIP模型将文本描述转化为视觉嵌入,随后利用UMAP降维技术将高维嵌入映射至二维空间。此过程中,通过调整'n_neighbors'参数值(分别为10、30和60),生成不同的UMAP拟合结果,并以不同列的形式呈现。
使用方法
用户可通过对数据集进行加载,直接获取文本描述对应的二维视觉嵌入坐标。这些坐标可用于进一步的数据分析,如图像美学质量的评估、可视化探索等。用户可根据不同的'n_neighbors'参数选择相应的嵌入坐标,以适应不同的研究需求。
背景与挑战
背景概述
LAION-Aesthetics数据集是在机器学习与艺术审美领域交叉研究背景下产生的成果,由LAION团队于近期创建。该数据集的构建旨在探索图像的审美价值与文本描述之间的关系,通过CLIP模型将文本描述与UMAP降维技术相结合,对LAION-Aesthetics原始数据集中的高评分图像进行嵌入表示。其研究成果对于图像处理、自然语言处理以及艺术审美领域均具有重要价值,推动了相关领域的技术进步与理论发展。
当前挑战
该数据集在构建过程中主要面临以下挑战:首先,如何精确地筛选出具有高审美价值的图像,确保数据集的质量与相关性;其次,如何有效地将文本描述与图像内容进行对应,以实现准确的嵌入表示;最后,在数据降维过程中,如何保持数据的原有结构特征,避免信息的丢失。这些挑战不仅涉及到数据处理与模型选择的技术问题,也涉及到对审美标准与艺术价值的深入理解与把握。
常用场景
经典使用场景
在人工智能研究领域,dclure/laion-aesthetics-12m-umap数据集被广泛用于图像美学评估。该数据集将LAION-Aesthetics图像库通过CLIP模型转换为UMAP嵌入,实现了图像美学特征向量的二维映射。这为研究者提供了一种直观的方式来探索和可视化图像的美学属性。
解决学术问题
该数据集解决了图像美学评价中主观性过强的问题,通过客观的算法模型将图像的审美特征量化,有助于推进图像美学领域的定量化研究。此外,它还促进了图像特征提取和降维技术的应用,为图像美学分类和相似度度量提供了可靠的数据基础。
实际应用
在实际应用中,dclure/laion-aesthetics-12m-umap数据集可用于图像检索系统、推荐算法以及图像内容审核等领域,通过分析图像的美学特征,提升系统的智能化水平和用户体验。
数据集最近研究
最新研究方向
在计算机视觉与自然语言处理领域,dclure/laion-aesthetics-12m-umap数据集以其独特的文本到图像美学特征映射而备受瞩目。该数据集通过CLIP模型将LAION-Aesthetics数据集中的文本描述转化为UMAP二维空间中的嵌入表示,不仅实现了高效的特征降维,还为图像美学评估提供了新的视角。近期研究集中于探索不同n_neighbors参数对美学特征映射的影响,从而在图像风格分析、推荐系统等领域展现出重要应用价值,为相关任务提供了有力的数据支撑和理论基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作