five

The Causal Chambers: Dataset Repository

收藏
github2024-04-18 更新2024-05-31 收录
下载链接:
https://github.com/juangamella/causal-chamber
下载链接
链接失效反馈
官方服务:
资源简介:
This repository contains datasets collected from the causal chambers, the two devices described in the 2024 paper The Causal Chambers: Real Physical Systems as a Testbed for AI Methodology by Juan L. Gamella, Jonas Peters and Peter Bühlmann. The repository is updated as we collect new datasets from the chambers.

本仓库收录了从因果舱(causal chambers)采集的数据集,这些数据集对应2024年Juan L. Gamella、Jonas Peters与Peter Bühlmann发表的论文《The Causal Chambers: Real Physical Systems as a Testbed for AI Methodology》中所描述的两款实验装置。本仓库将随我们从该舱体采集到新数据集而持续更新。
创建时间:
2024-04-17
原始信息汇总

数据集概述

数据集来源

本数据集来源于2024年发表的论文《The Causal Chambers: Real Physical Systems as a Testbed for AI Methodology》,由Juan L. Gamella, Jonas Peters和Peter Bühlmann共同撰写。数据集包含从两个设备——风洞和光洞中收集的数据。

数据集内容

数据集包含多种实验数据,主要用于AI方法论的测试,具体包括:

数据集名称 描述 使用场景
lt_camera_walks_v1 用于ICA案例研究(任务d3,图6)的图像数据 光洞
lt_color_regression_v1 用于OOD案例研究(任务b2,图5)的图像数据 光洞
lt_interventions_standard_v1 用于因果发现案例研究(图5)的光洞观测和干预数据 光洞
lt_walks_v1 用于ICA案例研究(任务d1,图6)的光洞执行器随机和确定性行走数据 光洞
wt_walks_v1 用于因果发现(任务a3)和ICA(任务d2)案例研究的风洞执行器随机和确定性行走数据 风洞
lt_malus_v1 用于符号回归任务(图6e)的光强度测量数据,展示Malus定律 光洞
wt_bernoulli_v1 用于符号回归任务(图6e)的空气压力测量数据,展示Bernoulli原理 风洞
wt_changepoints_v1 用于变化点检测案例研究(图5)的数据 风洞
wt_intake_impulse_v1 用于任务2c(图5)的气压曲线数据 风洞
wt_pressure_control_v1 风洞压力控制配置的数据 风洞
lt_test_v1 用于表征光洞物理效应的实验数据(图7-15) 光洞
wt_test_v1 用于表征风洞物理效应的实验数据(图7-15) 风洞
lt_camera_test_v1 用于表征光洞相机系统物理效应的实验数据 光洞
wt_validate_v1 用于验证风洞标准配置因果真值图的随机控制实验数据(附录V) 风洞
wt_pc_validate_v1 用于验证风洞压力控制配置因果真值图的随机控制实验数据(附录V) 风洞
lt_validate_v1 用于验证光洞标准配置因果真值图的随机控制实验数据(附录V) 光洞
lt_camera_validate_v1 用于验证光洞相机配置因果真值图的随机控制实验数据(附录V) 光洞

数据集使用许可

所有数据集均根据CC BY 4.0许可公开,允许用户自由使用、分享和修改数据集,但需适当引用原作者并说明变更。

数据集下载与使用

用户可以通过直接下载.zip文件或使用causalchamber Python包导入数据集。Python用户可通过pip install causalchamber安装包,并直接从Python代码中访问数据集。

搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自于2024年发表的论文《The Causal Chambers: Real Physical Systems as a Testbed for AI Methodology》,由Juan L. Gamella、Jonas Peters和Peter Bühlmann共同构建。数据集的构建基于两个物理设备——风洞和光隧道,这些设备被设计用于模拟和测试因果关系。数据通过在这些设备中进行的实验收集,涵盖了多种物理现象和实验配置。每个数据集的详细描述和实验配置均在论文的图3中有所说明,确保了数据集的科学性和可重复性。
特点
该数据集的显著特点在于其物理实验的真实性和多样性。数据集不仅包括观察性数据,还涵盖了干预性数据,适用于因果发现、独立成分分析(ICA)、符号回归等多种任务。此外,数据集提供了详细的实验配置和物理设备的机械模型,使得研究者能够深入理解数据的生成过程。通过Python包`causalchamber`,用户可以方便地导入和处理数据,进一步提升了数据集的实用性和可访问性。
使用方法
用户可以通过直接下载`.zip`文件或使用Python包`causalchamber`来获取数据集。安装包后,用户可以在Python代码中直接导入数据集,并通过提供的API访问特定实验的数据。例如,用户可以加载光强度数据进行符号回归分析。此外,数据集还提供了因果关系图的邻接矩阵,便于用户进行因果分析。通过这些工具,用户可以轻松地将数据集应用于各种科学研究和AI方法的验证。
背景与挑战
背景概述
The Causal Chambers数据集是由Juan L. Gamella、Jonas Peters和Peter Bühlmann于2024年创建的,旨在为人工智能方法论提供一个真实的物理系统测试平台。该数据集源自两台名为‘因果室’的设备,即风洞和光隧道,这些设备通过物理实验生成数据,用于验证和探索因果推断、独立成分分析(ICA)、符号回归等领域的算法。该数据集的发布不仅为相关领域的研究提供了丰富的实验数据,还通过开源的Python包`causalchamber`简化了数据的使用和分析,极大地推动了因果推理和物理系统建模的研究进展。
当前挑战
The Causal Chambers数据集在构建和应用过程中面临多项挑战。首先,物理系统的复杂性使得数据采集和处理变得困难,尤其是在确保数据质量和一致性方面。其次,因果推断任务需要精确的干预数据,如何设计有效的实验方案以获取高质量的干预数据是一个重要挑战。此外,数据集的多维度特性(包括图像、传感器数据等)增加了数据分析的复杂性,要求研究者具备跨学科的知识和技能。最后,验证因果关系真实性的实验设计也是一个难点,需要精心设计的随机对照实验来确保因果图的准确性。
常用场景
经典使用场景
The Causal Chambers数据集在因果推断领域中具有经典的使用场景,尤其是在因果发现和机制建模方面。该数据集通过物理系统中的观测和干预数据,为研究者提供了一个真实的实验平台,用于验证和开发新的因果推断算法。例如,数据集中的风洞和光隧道实验数据可用于因果图的构建和验证,以及独立成分分析(ICA)和符号回归等任务的实现。
解决学术问题
The Causal Chambers数据集解决了因果推断领域中多个重要的学术问题,包括因果结构的识别、干预效果的量化以及因果模型的验证。通过提供真实的物理系统数据,该数据集为研究者提供了一个可靠的基准,用于评估和比较不同的因果推断方法。这不仅推动了因果推断理论的发展,还为实际应用中的因果问题提供了新的解决方案。
衍生相关工作
The Causal Chambers数据集催生了一系列相关研究工作,包括因果推断算法的改进、机制模型的优化以及新实验设计的探索。例如,基于该数据集的研究者开发了新的因果发现算法,提升了因果图的准确性;同时,机制模型的实现为物理系统的仿真和预测提供了新的工具。这些工作不仅丰富了因果推断的理论框架,还为实际应用提供了强有力的支持。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作