Extreme_Environment_Generator_v1.0
收藏Hugging Face2025-12-01 更新2025-12-02 收录
下载链接:
https://huggingface.co/datasets/DBbun/Extreme_Environment_Generator_v1.0
下载链接
链接失效反馈官方服务:
资源简介:
Extreme_Environment_Generator是一个大型的合成数据集,通过可配置的Python模拟器生成,包含了来自深海地下、海底和冰冻世界等极端物理环境的多传感器时间序列数据。该数据集适用于机器学习研究,包括多变量预测、传感器融合、异常和罕见事件检测等多种应用。
创建时间:
2025-11-20
原始信息汇总
Extreme Environment Generator 数据集概述
数据集摘要
Extreme_Environment_Generator 是一个由可配置的 Python 模拟器生成的大型合成数据集。它生成受以下极端物理环境启发的多传感器时间序列数据:
- 地球深部地下
- 海洋下的海底环境
- 深冰世界和冰行星结构
每个生成的场景包含:
- 环境随时间变化的真实物理状态
- 有噪声/损坏的传感器测量值
- 层和材料剖面
- 环境配置
- 罕见故障事件
- 场景级汇总统计
该数据集专为机器学习研究设计,包括:
- 多元预测
- 传感器融合
- 异常和罕见事件检测
- 在噪声、漂移和缺失数据下的鲁棒性测试
- 极端合成环境中的强化学习
- 时间序列基础模型预训练
环境类型
- 深部地下:受地壳、地幔、外核和内核启发的高压、高温环境。包含从 0 公里到 6371 公里深度的 5 个固定层。
- 海底:包括水层、沉积物层和地壳层,然后是深部地下结构。早期深度阶段温度和压力较低,逐渐过渡到类似地幔的剖面。
- 冰世界:受冰卫星和系外行星启发。包括多公里厚的冰壳、冰-岩石过渡带和深层内部结构。
所有三种环境使用相同的模式,允许直接进行跨环境比较。
数据集结构
数据集包含以下表格:
状态表 (state_true)
每个时间步的真实物理状态。
| 字段 | 描述 | 单位 |
|---|---|---|
| scenario_id | 场景索引 | — |
| time_sec | 自开始的时间 | 秒 |
| depth_km | 模拟深度 | 公里 |
| true_temperature_C | 真实内部温度 | °C |
| true_pressure_GPa | 真实压力 | GPa |
| true_density_kg_m3 | 真实密度 | kg/m³ |
| true_phase | 固体/液体/塑性 | — |
| true_seismic_noise | 基线地震活动 | 任意单位 |
| true_vibration_level | 结构振动 | 任意单位 |
| stability_score | 稳定性 (0–1) | — |
| rare_event_flag | 如果发生极端事件则为 True | 布尔值 |
传感器表 (sensors)
从 state_true 导出的损坏传感器读数。
| 传感器 | 字段前缀 | 描述 |
|---|---|---|
| 温度 | temperature_ | 有噪声、漂移的温度 |
| 压力 | pressure_ | 有噪声且可能丢失的压力 |
| 加速度计 | accel_ | 以 g 为单位的加速度 |
| 地震 | seismic_ | 地震噪声 + 丢失 |
| 量子共振 | quantum_resonance_ | 虚构的高灵敏度传感器 |
| 中微子通量 | neutrino_flux_ | 虚构的深环境读数 |
| 自旋相干性 | spin_coherence_ | 虚构的材料自旋测量 |
| 引力波 | gravity_wave_ | 虚构的微重力扰动 |
所有传感器都包含受控的噪声、漂移和丢失行为。
故障表 (failures)
罕见的灾难性或近灾难性事件。
| 字段 | 描述 |
|---|---|
| scenario_id | 场景索引 |
| time_sec | 事件时间 |
| depth_km | 事件深度 |
| event_type | “thermal_spike”, “pressure_surge” 等 |
| severity | 0–1 归一化严重程度 |
层剖面表 (layer_profile)
每个环境内部层的静态描述。
| 字段 | 描述 |
|---|---|
| scenario_id | 场景索引 |
| layer_id | 层索引 |
| name | 层名称 |
| depth_start_km | 起始深度 |
| depth_end_km | 结束深度 |
| material_name | 材料 |
| density_kg_m3 | 扰动密度 |
| phase | 固体/塑性/液体 |
环境配置表 (environment_config)
每个场景的完整配置(行星、传感器、扰动等)。
汇总表 (summary)
每个场景的高级统计信息,包括最高温度、平均压力、故障数量和稳定性指标。
传感器详细描述
- 温度传感器:高斯噪声(°C)、随时间线性漂移、偶尔丢失。
- 压力传感器:乘性噪声(%)、丢失概率、跟踪大压力梯度。
- 加速度计:测量振动和加速度,用于不稳定性检测。
- 地震传感器:低频地震噪声,对层边界和罕见事件敏感。
- 量子共振传感器(虚构):极小的波动,适用于需要额外模态的 ML 模型。
- 中微子通量传感器(虚构):对密度变化敏感,受高能粒子通量启发。
- 自旋相干性传感器(虚构):测量微观振荡行为,与相变弱相关。
- 引力波传感器(虚构):信号非常小,产生超低水平噪声,增加了多模态融合任务的复杂性。
状态字段详细描述
- true_temperature_C:深度的真实物理温度,遵循环境的温度剖面。
- true_pressure_GPa:随深度增加的真实压力。
- true_density_kg_m3:当前层的密度(具有 ±5% 随机扰动)。
- true_phase:分类变量:固体、塑性、液体。
- true_seismic_noise:基础地震水平。
- true_vibration_level:模拟的机械振动。
- stability_score:表示环境局部稳定性的 0 到 1 之间的标量。
- rare_event_flag:布尔值,指示在该时间步是否发生了罕见的灾难性事件。
使用案例
- 多模态传感器融合
- 长时程预测
- 罕见事件检测
- 模型鲁棒性评估
- 时间序列基础模型预训练
- 合成物理环境中的强化学习
- 合成数据研究
- 仪器测试平台
局限性
- 物理过程是近似和合成的
- 传感器噪声是参数化的,非经验推导
- 罕见事件是人为触发的
- 层边界是简化的
许可证
MIT
引用
Kartoun, U. (2025). Extreme_Environment_Generator (DBbun LLC). Synthetic extreme-environment dataset for multimodal time-series research.
搜集汇总
数据集介绍

构建方式
该数据集通过可配置的Python模拟器生成,模拟了极端物理环境下的多传感器时间序列数据。构建过程涵盖了深部地下、海底及冰封星球三类典型环境,每个场景均包含真实物理状态、带噪声的传感器测量值、分层材料剖面及环境配置参数。数据生成时引入了可控的噪声、漂移和信号丢失机制,并嵌入了罕见故障事件,从而形成了一套结构完整且具有挑战性的合成数据集。
特点
数据集的核心特点在于其多模态传感器融合设计,涵盖了温度、压力、加速度及多种虚构传感器(如量子共振、中微子通量等),每种传感器均模拟了真实的噪声与异常行为。数据以时间序列形式组织,包含真实状态表、传感器表、故障事件表及环境分层剖面表,支持跨环境的直接比较。此外,数据集特别强调了罕见事件检测与模型鲁棒性测试,为时间序列预测与异常检测研究提供了丰富的实验场景。
使用方法
该数据集适用于多元时间序列预测、传感器融合、罕见事件检测及强化学习等多种机器学习任务。研究人员可通过加载不同的表格(如state_true、sensors、failures)获取环境状态、传感器观测及事件标签,进而构建监督或自监督学习模型。数据集支持对噪声、漂移与数据缺失的鲁棒性评估,也可作为时间序列基础模型预训练的合成数据源,为极端环境下的算法验证提供标准化测试平台。
背景与挑战
背景概述
Extreme_Environment_Generator_v1.0数据集由DBbun LLC于2025年创建,旨在通过可配置的Python模拟器生成极端物理环境下的多传感器时间序列数据。该数据集模拟了深地地下、海底及冰封星球等极端环境,涵盖了真实物理状态、噪声传感器测量、层状结构剖面及罕见故障事件。其核心研究问题聚焦于为机器学习提供合成基准,以应对多元时间序列预测、传感器融合、异常检测及模型鲁棒性测试等任务,推动了极端环境下时间序列分析及合成数据生成领域的研究进展。
当前挑战
该数据集致力于解决极端环境监测中多元时间序列预测与异常检测的挑战,包括在噪声、漂移及数据缺失条件下实现高精度传感器融合与罕见事件识别。构建过程中,挑战主要源于合成数据的物理近似性,如环境层状结构的简化、传感器噪声的参数化模拟而非实证推导,以及人工触发罕见事件可能导致的现实偏差,这些因素限制了数据在真实世界应用中的泛化能力。
常用场景
经典使用场景
在极端环境仿真领域,Extreme_Environment_Generator_v1.0数据集为多传感器时间序列分析提供了经典范例。该数据集通过模拟深地、深海及冰封星球等极端物理环境,生成了包含温度、压力、振动及虚构量子共振等多元传感信号的时间序列数据。研究者常利用其进行多模态传感器融合与长时程预测任务,通过整合真实物理状态与带噪声的传感器读数,探索在复杂噪声、漂移及数据缺失条件下模型的鲁棒性表现,为极端环境下的监测与预报系统奠定算法基础。
实际应用
在实际工程与科研中,该数据集被广泛应用于极端环境监测系统的原型开发与测试。例如,在深海勘探或行星探测任务中,可用于模拟传感器网络在高压、高温或高振动条件下的性能退化,辅助设计故障诊断与预警算法。同时,它为仪器仪表测试平台提供了安全的合成数据源,避免了真实极端环境实验的高成本与高风险,加速了自适应控制与自主决策系统在航天、地质及能源领域的应用落地。
衍生相关工作
围绕该数据集,已衍生出多项经典研究工作,主要集中在时间序列基础模型预训练与强化学习领域。例如,研究者利用其多模态传感器数据训练Transformer架构的预测模型,以提升对罕见事件如热峰值或压力突变的检测灵敏度。此外,该数据集也被用于构建合成物理环境中的强化学习智能体,训练其在极端动态条件下进行稳定控制与决策,推动了仿真到现实迁移学习在危险环境操作中的算法进步。
以上内容由遇见数据集搜集并总结生成



