five

AIGC-T23DAQA|3D资产生成数据集|质量评估数据集

收藏
arXiv2025-02-24 更新2025-02-26 收录
3D资产生成
质量评估
下载链接:
https://github.com/ZedFu/T23DAQA
下载链接
链接失效反馈
资源简介:
AIGC-T23DAQA数据库是目前最大的文本到3D资产质量评估数据库,由上海交通大学构建。该数据库包含了通过6种流行的文本到3D资产生成模型,使用170个文本提示生成的969个经过验证的3D资产,以及分别从质量、真实性和文本资产对应性三个方面对这些资产的主观质量评分。该数据库旨在为文本引导的3D生成质量评估问题提供研究基础,并可用于评估生成3D资产的质量,优化模型训练,选择最佳3D资产等应用。
提供机构:
上海交通大学
创建时间:
2025-02-24
AI搜集汇总
数据集介绍
main_image_url
构建方式
AIGC-T23DAQA数据集的构建始于对生成式对抗网络(GAN)在文本到3D资产(T23DA)生成领域的应用。研究人员通过六种流行的T23DA生成模型,使用170个文本提示生成969个验证的3D资产,并从质量、真实性和文本-资产对应性三个维度对这些资产进行了主观质量评分。数据集的构建过程包括精细的提示选择、3D资产的生成、主观实验以及数据处理等多个步骤,确保了数据集的多样性和可靠性。
特点
AIGC-T23DAQA数据集的特点在于其全面性和多样性。首先,数据集包含了从多个维度对生成的3D资产进行的主观质量评分,这为研究提供了丰富的视角。其次,数据集涵盖了六种不同的T23DA生成模型,确保了模型评估的全面性。此外,数据集还包含了由不同长度文本提示生成的3D资产,进一步增加了数据集的多样性。
使用方法
AIGC-T23DAQA数据集的使用方法主要分为两个阶段。首先,研究人员使用3D编码器、两个2D编码器和多模态基础模型从投影视频中提取与人类偏好相关的特征,包括3D形状、纹理和文本-资产对应性。然后,将提取的特征融合在一起,使用回归模块将这些特征映射到偏好分数,从而对生成的3D资产的质量、真实性和文本-资产对应性进行评估。
背景与挑战
背景概述
在计算机视觉和人工智能领域,3D资产生成技术一直备受关注。近年来,得益于文本到图像生成技术的突破,文本到3D资产生成技术也得到了快速发展。然而,对于生成3D资产的质量评估却未得到充分研究和考虑。为了解决这一问题,研究人员建立了迄今为止最大的文本到3D资产质量评估数据库,名为AIGC-T23DAQA数据库。该数据库包含969个经过验证的3D资产,这些资产由6种流行的文本到3D资产生成模型生成,并且对应地包含了从质量、真实性和文本-资产对应性三个方面对资产的主观质量评分。基于此数据库,研究人员还建立了一个全面的基准,并设计了一种有效的T23DAQA模型,用于从上述三个方面评估生成的3D资产。实验结果表明,该方法在评估AI生成的3D资产质量方面具有有效性,并且与人类感知更为一致。
当前挑战
AIGC-T23DAQA数据集面临的主要挑战包括:1) 所解决的领域问题是文本到3D资产生成技术的质量评估。目前,对于生成的3D资产的质量评估方法尚不完善,无法充分满足实际应用的需求。2) 构建过程中所遇到的挑战包括:3D资产生成过程耗时较长,且主观实验评估过程也较为耗时;现有的质量评估模型难以评估文本到3D资产的真实性和文本-资产对应性;对于生成的3D资产,由于其使用隐式神经辐射场进行表示,缺乏统一的格式,难以进行质量评估。为了解决这些挑战,研究人员提出了基于投影的视频质量评估算法,并建立了包含多个角度评估的基准数据库。
常用场景
经典使用场景
AIGC-T23DAQA数据集主要用于对文本到3D资产生成模型进行质量评估,包括形状、纹理和文本-资产对应性三个方面。该数据集包含了969个经过验证的3D资产,这些资产是通过6种流行的文本到3D资产生成模型从170个提示中生成的。此外,数据集还包含了从质量、真实性和文本-资产对应性三个方面对资产的主观质量评分。通过使用AIGC-T23DAQA数据集,研究人员可以评估文本到3D资产生成模型的质量,并选择生成质量较高的3D资产。
实际应用
AIGC-T23DAQA数据集在游戏设计和电影制作等领域具有实际应用场景。游戏设计师和电影制作人员可以使用该数据集来选择生成质量较高的3D资产,从而提高游戏和电影的视觉效果。此外,该数据集还可以用于优化文本到3D资产生成模型,使其能够生成更高质量和更真实的3D资产。
衍生相关工作
AIGC-T23DAQA数据集衍生了相关的经典工作,如T23DAQA模型。T23DAQA模型是一种基于投影的评估算法,可以从形状、纹理和文本-资产对应性三个方面提取感知质量特征,并融合这些特征来预测质量、真实性和文本-资产对应性评分。实验结果表明,T23DAQA模型在评估文本到3D资产质量方面优于现有的模型。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

LFW

人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download

AI_Studio 收录

poi

本项目收集国内POI兴趣点,当前版本数据来自于openstreetmap。

github 收录

MedDialog

MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。

github 收录

flames-and-smoke-datasets

该仓库总结了多个公开的火焰和烟雾数据集,包括DFS、D-Fire dataset、FASDD、FLAME、BoWFire、VisiFire、fire-smoke-detect-yolov4、Forest Fire等数据集。每个数据集都有详细的描述,包括数据来源、图像数量、标注信息等。

github 收录

Arizona Cities by Population

A dataset listing Arizona cities by population for 2024.

www.arizona-demographics.com 收录