five

living-room-passes

收藏
Hugging Face2024-06-19 更新2024-12-12 收录
下载链接:
https://huggingface.co/datasets/Nfiniteai/living-room-passes
下载链接
链接失效反馈
官方服务:
资源简介:
nfinite-living-room-passes数据集包含从3D模型渲染的客厅空间常见物品的图像。该数据集包含500种产品,共计10500张图像,每种产品都从3D模型以照片级真实感渲染,并提供其法线贴图、深度贴图等系列图像。这些3D模型是通用模型,旨在支持开源社区,提供丰富多样的数据以训练或改进现有算法。数据集支持多种任务,如自动深度估计、法线贴图估计等,并提供详细的图像特征和文本描述,适用于图像理解和分类等研究。
创建时间:
2024-06-11
原始信息汇总

数据集概述

基本信息

  • 语言: 英语
  • 许可证: CC BY-SA 4.0
  • 数据量: 1K < n < 10K
  • 任务类别: 深度估计、图像分类、图像分割、文本到图像、图像到文本、图像到图像、零样本图像分类、掩码生成、零样本目标检测、图像特征提取
  • 数据集名称: Living Room Passes

数据集结构

特征字段

  • id: 字符串
  • camera: 字符串
  • category: 字符串
  • bbox.x1: 整数
  • bbox.y1: 整数
  • bbox.width: 整数
  • bbox.height: 整数
  • dimensions.width: 浮点数
  • dimensions.height: 浮点数
  • dimensions.depth: 浮点数
  • depth_model: 图像
  • mask_model: 图像
  • realtime_u: 图像
  • mat_id: 图像
  • normal_ts: 图像
  • uvw: 图像
  • contour: 图像
  • general_information.style: 字符串
  • general_information.shape: 字符串
  • general_information.pattern: 字符串
  • general_information.room: 字符串序列
  • materials_and_colors.primary_material: 字符串
  • materials_and_colors.primary_color: 字符串
  • materials_and_colors.secondary_material: 字符串
  • materials_and_colors.secondary_color: 字符串

数据分割

  • 训练集:
    • 字节数: 2770348689.5
    • 样本数: 1500
  • 下载大小: 2938171692
  • 数据集大小: 2770348689.5

配置

  • 配置名称: default
  • 数据文件:
    • 分割: train
    • 路径: data/train-*

数据集描述

数据集摘要

nfinite-living-room-passes 数据集包含来自3D模型的图像,这些对象通常位于客厅空间。共有500种产品,跨越10500张图像。

支持的任务

该数据集可用于仅研究目的,训练或改进模型在自动深度估计、自动法线图估计、前景/背景分离等方面的算法。

语言

数据集由图像组成,因此没有文本数据,除了对象的类别和相机的名称。这些可以使用美国或英国英语单词互换使用。

数据实例

一个数据点是一个产品,由其ID定义。每个产品从3个相机的视角进行渲染。对于每个产品,我们可以访问一些数据(例如其类别、样式)或图像中产品的边界框坐标。

数据字段

  • sku: 唯一仅包含数字的字符串。每个sku在整个数据集中都是唯一的
  • camera: 相机名称,表示产品渲染的位置。可能的值有[THREE_QUARTERS_BACK_RIGHT, THREE_QUARTERS_RIGHT, FRONT]
  • general_information.style: 描述产品设计风格的字母数字小写字符串
  • general_information.shape: 描述产品在空间中大致全局形状的字母数字小写字符串
  • general_information.pattern: 描述图像上产品主要材料纹理的全局外观的字母数字小写字符串
  • general_information.room: 列出产品可以放置的房间的仅字母小写字符串。这些房间通常在欧洲和美国房屋中找到
  • materials_and_colors.primary_material: 列出图像上最突出的材料的字母数字小写字符串
  • materials_and_colors.primary_color: 列出图像上最突出的颜色或颜色的字母数字小写字符串。颜色名称主要是美国英语
  • materials_and_colors.secondary_material: 列出图像上第二突出的材料或材料的字母数字小写字符串
  • materials_and_colors.secondary_color: 列出图像上第二突出的颜色或颜色的字母数字小写字符串。颜色名称主要是美国英语
  • bbox.x1: 图像中对象边界框的左上X坐标,以像素为单位(最小值=0,最大值=图像宽度)
  • bbox.y1: 图像中对象边界框的左上Y坐标,以像素为单位(最小值=0,最大值=图像高度)
  • bbox.width: 图像中对象边界框的宽度,以像素为单位(最小值=0,最大值=图像宽度)
  • bbox.height: 图像中对象边界框的高度,以像素为单位(最小值=0,最大值=图像高度)
  • categoryModel: 列出产品唯一类别的字母数字小写字符串。类别名称是美国英语或英国英语
  • boundingBox.depth: 真实世界中对象边界框的深度,以米为单位,始终为正
  • boundingBox.height: 真实世界中对象边界框的高度,以米为单位,始终为正
  • boundingBox.width: 真实世界中对象边界框的宽度,以米为单位,始终为正
  • contour: 模型的轮廓 - 灰度 - 无抗锯齿 - 具有透明度的材料可以有灰色值 - RGB24文件,2048x2048像素,无嵌入颜色配置文件,sRGB
  • depth_model: 模型的深度图 - 灰度 - MSAAX8抗锯齿 - 具有透明度的材料可以有灰色值 - RGB24文件,2048x2048像素,无嵌入颜色配置文件,sRGB
  • mask_model: 模型的掩码 - 黑白 - MSAAX8抗锯齿 - RGB24文件,2048x2048像素,无嵌入颜色配置文件,sRGB
  • mat_id: 模型的材料ID图 - RGB - MSAAX8抗锯齿 - RGB24文件,2048x2048像素,无嵌入颜色配置文件,sRGB
  • normal_ts: 模型的法线图,切线空间 - RGB - MSAAX8抗锯齿 - RGB24文件,2048x2048像素,无嵌入颜色配置文件,sRGB
  • uvw: 模型的uvw图(世界空间中的UV图) - RGB - MSAAX8抗锯齿 - RGB24文件,2048x2048像素,无嵌入颜色配置文件,sRGB
  • realtime_u: 产品的最终实时3D渲染,在Unity中(Builtin,带有定制的着色器) - RGB - MSAAX8抗锯齿 - RGB24文件,2048x2048像素,无嵌入颜色配置文件,sRGB

数据分割

数据没有分成不同的集合。最终用户可以根据自己的启发式方法选择分布。

数据集创建

创建理由

nfinite-living-room-passes 是为提供与给定产品可以渲染的各种通道相关的3D产品图像而构建的。500种产品是随机选择的,但在一个提供客厅空间产品良好覆盖的列表中。

源数据

3D模型创建为GLB文件,具有在渲染时可用的“经典”漫反射、法线、ORM贴图。3D渲染引擎是Unity,使用Builtin管道,有时使用定制的着色器以更好地在实时中描绘材料。产品不会在环境中投射任何阴影。Unity 2021.3 LTS用于图像的生产。所有图像都以PNG格式提供,并通过一系列压缩操作(通过ZopfliPNG、OxiPNG、PNGOUT、AdvPNG和PNGCrush在MacOS上使用ImageOptim默认预设)进行处理。通过此过程,我们以无损方式节省了超过**70%**的最终文件大小,以节省所有用户的网络传输时间!

注释

图像的标注或标题使用GPT4.0 turbo完成,采用API模式。使用的模型是gpt-4-turbo-2024-04-09。温度为0.1。

注释过程

API以JSON模式使用,每个图像输出一个JSON。

个人和敏感信息

所有用于3D模型的对象都是通用的,属于nfinite。任何相似之处纯属巧合,并非有意为之。语料库中没有个人或敏感信息。

使用数据的注意事项

数据集的影响

该数据集的目的是帮助开发更好的图像理解算法。

偏见讨论

虽然我们试图涵盖各种产品类别,但这里考虑的客厅主要是欧洲和美国家具风格。

附加信息

数据集策展人

数据集最初由nfinite的R&D团队创建。

许可信息

数据集根据**Creative Commons Attribution-NonCommercial-ShareAlike (CC BY-NC-SA)**许可证(https://creativecommons.org/licenses/by-nc-sa/4.0/deed.en)进行许可。此许可证允许您非商业性地混合、调整和构建作品,只要您注明nfinite并使用相同的条款许可您的新创作。

引用信息

@inproceedings{nfinite-lrp-1, author = {Darina Helart, Guillaume Hertault, Loïc Toungoue, Jean-Philippe Deblonde}, editor = {nfinite R&D Team}, title = {nfinite LRP01: nfinite-living-room-passes}, year = {2024} }

搜集汇总
数据集介绍
main_image_url
构建方式
nfinite-living-room-passes数据集通过3D建模技术构建,包含500种常见于客厅空间的物品,共计10500张图像。这些图像通过Unity引擎渲染生成,采用实时3D渲染技术,并结合了多种图像处理工具进行优化,以确保图像质量和文件大小的平衡。每个物品从三个不同视角进行渲染,并提供了深度图、法线图等多种图像信息。文本标注部分通过GPT-4 Turbo模型生成,确保了标注的一致性和准确性。
使用方法
nfinite-living-room-passes数据集适用于多种计算机视觉任务,包括深度估计、法线图估计、前景/背景分离等。研究人员可以通过该数据集训练或优化现有算法,特别是在图像理解和3D重建领域。数据集未进行预定义的分割,用户可根据需求自行划分训练集和测试集。使用该数据集时,需遵循CC BY-NC-SA 4.0许可协议,确保非商业用途并注明来源。
背景与挑战
背景概述
nfinite-living-room-passes数据集由nfinite公司的研发团队于2024年6月17日发布,旨在为开源社区提供一个高质量且多样化的3D图像数据集,主要用于客厅空间中的物体识别与图像处理任务。该数据集包含500种产品,涵盖10500张图像,每张图像均通过3D模型渲染生成,并提供了深度图、法线图等多种图像信息。数据集的核心研究问题在于如何通过合成数据提升图像理解算法的性能,尤其是在深度估计、法线图生成、前景背景分离等任务中的应用。该数据集的发布为相关领域的研究提供了丰富的训练资源,推动了计算机视觉与图像处理技术的进步。
当前挑战
nfinite-living-room-passes数据集在构建与应用过程中面临多重挑战。首先,尽管数据集覆盖了多种客厅产品,但其风格主要集中在欧美家具设计,可能导致模型在其他文化背景下的泛化能力受限。其次,数据集的构建依赖于3D模型的渲染,虽然确保了图像的高质量,但合成数据与真实场景之间的差异可能影响模型在实际应用中的表现。此外,数据标注过程中使用了GPT-4 Turbo模型生成文本信息,尽管经过标准化处理,但仍可能存在语义不一致或偏差问题。最后,数据集的非商业使用许可限制了其在商业场景中的应用,可能影响其广泛推广与落地。
常用场景
经典使用场景
nfinite-living-room-passes数据集主要用于计算机视觉领域的研究,特别是在深度估计、图像分割和图像分类等任务中。该数据集通过提供高质量的3D渲染图像及其相关的深度图、法线图等信息,为研究人员提供了一个丰富的训练和测试平台。这些图像涵盖了客厅空间中常见的500种产品,能够有效支持算法的开发和优化。
解决学术问题
该数据集解决了计算机视觉领域中多个关键问题,如自动深度估计、法线图生成以及前景与背景分离等。通过提供多样化的3D渲染图像和详细的标注信息,研究人员能够更好地训练和验证模型,提升算法的鲁棒性和准确性。此外,数据集中的合成数据避免了真实数据中可能存在的隐私问题,为学术研究提供了安全且高效的数据源。
实际应用
nfinite-living-room-passes数据集在实际应用中具有广泛的价值。例如,在家具设计和室内装饰领域,该数据集可以用于开发智能家居系统,帮助用户通过虚拟现实技术预览家具在客厅中的摆放效果。此外,该数据集还可用于增强现实(AR)应用的开发,为用户提供更加沉浸式的购物体验。
数据集最近研究
最新研究方向
近年来,随着计算机视觉和深度学习技术的迅猛发展,nfinite-living-room-passes数据集在多个前沿研究方向上展现出重要价值。该数据集通过提供高质量的3D渲染图像及其深度图、法线图等多模态信息,为深度估计、图像分割、零样本物体检测等任务提供了丰富的数据支持。特别是在室内场景理解领域,该数据集能够帮助研究者开发更精确的算法,以应对复杂环境下的物体识别与定位挑战。此外,结合生成式AI技术,该数据集还被广泛应用于图像生成与编辑任务,推动了虚拟现实与增强现实技术的发展。其多样化的数据标注和跨文化场景覆盖,也为全球范围内的研究者提供了宝贵的资源,进一步促进了计算机视觉领域的国际合作与创新。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作