3DTime
收藏Hugging Face2025-08-01 更新2025-08-02 收录
下载链接:
https://huggingface.co/datasets/3DTimeDataset/3DTime
下载链接
链接失效反馈官方服务:
资源简介:
3DTime是一个大规模多标注多变量时间序列数据集,专为3D打印时长预测而设计。它包含了大量的3D模型及其对应的G-code文件,这些文件记录了打印过程中的详细指令。数据集分为原始版本和缩小版,原始版本包含9930个3D模型和39720个G-code文件,而缩小版则包含100个3D模型和400个G-code文件,分别约为原始版本的1%。
创建时间:
2025-07-24
原始信息汇总
3DTime数据集概述
基本信息
- 许可证: CC-BY-4.0
- 任务类别: 时间序列预测
- 标签: G-code, 3D打印, 时间序列, 打印时长, 回归, 外部回归, 多变量
- 数据集名称: 3DTime: A Large Dataset of Multi-Annotated Multivariate Time-Series for 3D-printing Duration
- 数据规模: 10M < n < 100M
数据集内容
原始数据集
- 3D模型数量: 9,930个,每个模型切片4次
- 注释G-code文件: 39,720个(压缩)
- 二进制文件: 39,720个
- G-code指令总数: 12,442,224,222条
当前版本(精简版)
- 3D模型数量: 100个(约完整数据集的1%),每个模型切片4次
- 注释G-code文件: 400个(压缩)
- 二进制文件: 400个
- G-code指令总数: 64,394,143条(约完整数据集的0.5%)
数据加载器
- 框架: PyTorch
- 特点: 由于数据格式特殊(每个G-code文件长度不一,部分文件指令数超过数百万条),提供了专门设计的数据加载器,而非标准的Hugging Face自动加载器。
其他信息
- 论文状态: 正在AAAI-26会议主技术轨道评审中
- 完整数据集大小: 1.2 TB(当前版本为精简版)
- 代码包含: 数据集生成、统计分析和模型训练所需的所有代码
搜集汇总
数据集介绍

构建方式
在增材制造领域,3DTime数据集通过系统化采集与标注流程构建而成。研究团队选取了9,930个具有代表性的3D模型进行四次分层切片处理,生成39,720个带注释的G-code文件,完整版本包含超过124亿条G-code指令。考虑到数据匿名化处理的挑战,当前发布的精简版本包含100个3D模型及其对应的400个G-code文件,总计约6,400万条指令,完整保留了原始数据结构与标注体系。
特点
作为面向3D打印时长预测的多变量时间序列数据集,3DTime的突出特点体现在其多维度标注体系和海量工业级数据规模。数据集不仅包含标准G-code指令流,还整合了二进制格式的辅助信息,每个样本都经过四次独立切片以增强数据多样性。其多元回归特性特别适合研究打印参数与耗时之间的复杂非线性关系,为时间序列预测领域提供了极具挑战性的基准测试平台。
使用方法
针对G-code指令长度差异大的特性,数据集配套提供了专为PyTorch框架优化的定制化数据加载器。使用者需通过作者提供的专用接口访问数据,该方案有效解决了传统Hugging Face自动加载器处理超长序列的局限性。配套代码库完整复现了论文中的数据处理流程,包括统计分析方法与模型训练方案,为研究者提供了端到端的实验复现基础。
背景与挑战
背景概述
3DTime数据集作为面向3D打印时间预测领域的大规模多变量时间序列数据集,由研究团队为AAAI-26会议主技术轨道研发,旨在解决增材制造过程中打印耗时预测的关键问题。该数据集收录了9,930个3D模型经四重切片处理后生成的39,720条带标注G代码文件,总计包含124亿条G代码指令,其多维时间序列特性为研究3D打印参数优化、能耗控制及智能排产等工业4.0核心课题提供了数据基础。通过融合挤出机运动轨迹、材料温度、层间冷却时间等多模态传感器数据,该数据集显著推进了制造过程数字孪生领域的研究进程。
当前挑战
在领域问题层面,3DTime需应对3D打印持续时间预测中非线性工艺参数耦合、设备异构性导致的预测模型泛化等挑战,其多元时间序列的异步采样特性对传统回归算法构成显著考验。数据集构建过程中,研究团队面临超12亿条G代码指令的标准化标注难题,需开发专用解析工具处理不同切片软件生成的异构数据格式。TB级原始数据的匿名化处理与分布式存储方案设计,以及长序列样本(部分超百万条指令)的批量加载与内存优化,均为该数据集构建的关键技术瓶颈。
常用场景
经典使用场景
在增材制造领域,3DTime数据集为研究3D打印时间预测提供了关键的多变量时间序列数据。该数据集通过记录不同3D模型切片后的G-code指令序列,为时间序列预测模型训练提供了丰富的输入特征。研究人员可以基于该数据集构建回归模型,准确预测特定3D打印任务的持续时间,从而优化打印队列调度和资源分配。
衍生相关工作
基于3DTime数据集已衍生出多个创新性研究。有学者提出了融合注意力机制的时间序列网络,显著提升了长序列G-code的处理效率。另有工作将该数据集与热力学仿真结合,开发出考虑材料特性的打印时间预测框架。这些研究推动了智能制造领域算法的发展,为后续研究奠定了方法论基础。
数据集最近研究
最新研究方向
在增材制造领域,3D打印时间预测一直是优化生产效率的关键课题。3DTime数据集以其海量多注释多元时间序列特性,为深度学习模型在G-code指令级时序分析提供了全新研究维度。当前前沿研究聚焦于基于Transformer架构的异质长序列建模,通过解构打印指令与耗时的非线性映射关系,突破传统回归算法的性能瓶颈。该数据集的出现恰逢工业4.0推进智能制造的浪潮,其百万级指令样本为解释性人工智能在制造参数优化中的应用提供了基准测试平台,相关研究成果已被纳入国际自动控制联合会关于数字孪生系统的技术白皮书讨论范畴。
以上内容由遇见数据集搜集并总结生成



