five

SLICE-100K

收藏
arXiv2024-07-05 更新2024-08-06 收录
下载链接:
http://arxiv.org/abs/2407.04180v1
下载链接
链接失效反馈
官方服务:
资源简介:
SLICE-100K是由爱荷华州立大学和纽约大学联合创建的多模态数据集,专注于挤压式3D打印技术。该数据集包含超过100,000个G-code文件及其对应的STL CAD模型、渲染图像和LVIS分类,数据来源于Objaverse-XL和Thingi10K。数据集的创建过程涉及从这些源数据集中筛选和处理3D模型,生成相应的G-code文件,并进行渲染和分类。SLICE-100K旨在支持计算机辅助设计和制造领域的研究,特别是在3D打印和G-code转换方面。

SLICE-100K is a multimodal dataset jointly created by Iowa State University and New York University, focusing on extrusion-based 3D printing technology. This dataset comprises over 100,000 G-code files paired with their corresponding STL CAD models, rendered images, and LVIS classifications, and is sourced from Objaverse-XL and Thingi10K. The dataset creation process involves screening and processing 3D models from these source datasets, generating corresponding G-code files, as well as performing rendering and classification tasks. SLICE-100K aims to support research in the field of computer-aided design and manufacturing, particularly in the areas of 3D printing and G-code conversion.
提供机构:
爱荷华州立大学,纽约大学
创建时间:
2024-07-05
搜集汇总
数据集介绍
main_image_url
构建方式
SLICE-100K数据集的构建基于从Objaverse-XL和Thingi10K数据集中提取的三角剖分网格模型。首先,研究人员从Objaverse-XL的Thingiverse分支下载STL模型,并从Thingi10K数据集中筛选出符合特定条件的模型。然后,使用PrusaSlicer软件将所有模型切片,生成G-code文件。为了确保G-code文件的多样性,切片过程中随机选择了四种不同的填充模式。此外,研究人员还利用Blender渲染脚本为每个模型生成了10个视图的渲染图,包括6个正交视图和4个等距视图。最后,通过预训练的Vision-Language模型对模型进行分类,并生成每个模型的LVIS类别。
特点
SLICE-100K数据集的主要特点包括超过10万个G-code文件,以及它们对应的STL CAD文件、渲染图、LVIS类别和元数据。这个数据集是首个专门为制造应用而设计的多模态数据集,包含了各种3D可打印物体,为训练制造领域特定的基础模型提供了丰富的资源。数据集的构建旨在促进视觉语言模型在增材制造中的应用,并鼓励研究社区在设计和制造领域解决新问题。
使用方法
SLICE-100K数据集可以用于多种任务,包括G-code几何变换、G-code风味翻译以及3D形状建模等。研究人员展示了该数据集在微调GPT-2模型以实现G-code翻译方面的效用,以及评估现有LLM进行G-code几何变换的能力。此外,该数据集还可以用于训练LLM,以实现G-code调试、几何变换和解释等任务。为了衡量G-code生成模型的质量,研究人员引入了基于图像空间的IoU指标,通过渲染每个层并计算2D IoU来评估模型的准确性。
背景与挑战
背景概述
在数字设计与计算机辅助制造技术融合的背景下,增材制造或3D打印技术在制造行业中引发了重大创新。基于挤压的增材制造,尤其是熔融沉积成型(FDM),为制造塑料或聚合物零件提供了可能。然而,目前缺乏一个包含大量精心策划的CAD模型及其对应G-code文件的综合数据库。为了解决这个问题,SLICE-100K数据集应运而生。这是一个包含超过10万个G-code文件、其网格化的CAD模型、LVIS类别、几何属性和渲染图的独特数据集。该数据集从Objaverse-XL和Thingi10K数据集中提取的三角网格模型构建而成,旨在为数字制造的多模态基础模型开发奠定基础。
当前挑战
SLICE-100K数据集面临的挑战包括:1) 解决领域问题:尽管SLICE-100K为LLMs在3D打印中的应用提供了资源,但G-code的低级别性质和上下文窗口限制给机器学习带来了挑战。2) 构建过程中遇到的挑战:G-code文件的长度和复杂性使得手动调试困难。此外,SLICE-100K中所有模型都沿默认的Z方向进行切片,这可能限制了其在多方向切片技术研究中的应用。
常用场景
经典使用场景
SLICE-100K数据集在3D打印领域具有重要的应用价值,它为研究者和开发者提供了一个庞大的G-code文件库,以及相应的STL模型、渲染图像和元数据。该数据集最经典的使用场景之一是用于训练和评估语言模型,特别是针对G-code的几何变换和代码翻译任务。通过对SLICE-100K数据集进行微调,研究人员可以提升现有语言模型在3D打印领域的性能,实现更精确的G-code生成和转换。
实际应用
SLICE-100K数据集在实际应用中具有广泛的前景。通过训练和评估语言模型,SLICE-100K可以帮助开发者提升3D打印软件的智能化水平,实现更高效、精确的打印过程。此外,该数据集还可以用于开发新的3D打印应用程序,例如基于自然语言的3D打印设计工具,以及用于打印过程监控和故障诊断的系统。SLICE-100K数据集的推出,将为3D打印技术的发展和应用带来新的机遇。
衍生相关工作
SLICE-100K数据集的推出,将推动相关研究的进一步发展。未来,研究人员可以利用SLICE-100K数据集开发更先进的语言模型,以实现更复杂的G-code操作和转换任务。此外,SLICE-100K数据集还可以与其他3D打印相关数据集相结合,构建更全面的数字制造基础模型。这将有助于推动数字制造领域的创新,并为3D打印技术的广泛应用奠定基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作