five

RODEM Jet Datasets

收藏
arXiv2024-08-21 更新2024-08-23 收录
下载链接:
https://zenodo.org/records/12793616
下载链接
链接失效反馈
官方服务:
资源简介:
RODEM Jet Datasets是由日内瓦大学和哈佛大学联合创建的综合性模拟大半径喷注数据集,旨在支持粒子物理学中机器学习算法的开发与评估。该数据集包含多种喷注源,如夸克/胶子喷注、W玻色子、顶夸克及新物理粒子的衰变产物,提供了详细的子结构信息,包括喷注运动学、构成粒子运动学及轨迹位移细节。数据集的创建过程涉及使用MadGraph5_aMC@NLO框架进行模拟,以及Pythia和Delphes软件进行粒子簇射和探测器响应模拟。该数据集主要应用于喷注标记、异常检测和生成模型等领域,旨在提高喷注识别的准确性和发现新物理现象的能力。

The RODEM Jet Datasets is a comprehensive simulated large-radius jet dataset jointly developed by the University of Geneva and Harvard University, designed to support the development and evaluation of machine learning algorithms in particle physics. This dataset encompasses various jet origins, including quark/gluon jets, W bosons, top quarks, and decay products of new physics particles, and provides detailed substructure information such as jet kinematics, constituent particle kinematics, and track displacement details. The creation of the dataset employs the MadGraph5_aMC@NLO framework for simulation, alongside the Pythia and Delphes software packages for particle showering and detector response simulations. Primarily applied in domains like jet tagging, anomaly detection, and generative models, this dataset aims to enhance the accuracy of jet identification and the capacity for discovering new physical phenomena.
提供机构:
高能粒子物理与核子物理系,日内瓦大学,瑞士;粒子物理与宇宙学实验室,哈佛大学,剑桥,马萨诸塞州,美国
创建时间:
2024-08-21
搜集汇总
数据集介绍
main_image_url
构建方式
RODEM Jet Datasets 是通过对质子-质子碰撞进行模拟生成的,旨在为粒子物理中的机器学习算法开发与评估提供支持。数据集包含了各种喷流源,包括夸克/胶子喷流、W玻色子衰变产生的喷流、顶夸克喷流以及重新物理粒子的喷流。数据集提供了详细的子结构信息,包括喷流运动学、构成元素运动学和相对于主要相互作用顶点的轨迹偏移细节,使其在喷流标记、异常检测和生成模型构建等领域具有广泛应用。
特点
RODEM Jet Datasets 的特点在于其全面性和细粒度。数据集涵盖了从单支夸克/胶子喷流到多支W玻色子、顶夸克以及重BSM粒子的喷流。此外,数据集还提供了完整的运动学信息以及一系列子结构指标,如N-subjettiness、exclusive splitting scales和energy correlation functions等。这些指标能够捕捉喷流的内部结构,为机器学习模型提供了丰富的训练和验证数据。
使用方法
使用 RODEM Jet Datasets 进行研究时,研究人员首先需要下载数据集,该数据集以.hdf5格式提供,并分为训练集、验证集和测试集。在处理数据集时,研究人员可以访问喷流级别的观测数据和构成元素级别的详细信息。喷流级别的观测数据包括喷流的运动学数据和七个子结构指标,而构成元素级别的详细信息则包括每个构成元素的运动学数据、电荷信息和轨迹偏移细节。这些数据可以用于训练和验证机器学习模型,以实现对喷流的更精确理解和分类。
背景与挑战
背景概述
RODEM Jet Datasets是一组由Knut Zoch、John Andrew Raine、Debajyoti Sengupta和Tobias Golling等研究人员创建的模拟大半径喷注数据集。这些数据集旨在支持粒子物理学中机器学习算法的发展和评估。数据集包含了多种喷注源,包括夸克/胶子喷注、W玻色子衰变产生的喷注、顶夸克喷注以及重新物理粒子的喷注。数据集提供了详细的亚结构信息,包括喷注动力学、成分动力学以及轨迹位移细节,使其在喷注标记、异常检测和生成模型构建等领域具有广泛的应用前景。该数据集创建于2024年,并在Zenodo平台上公开发布,对粒子物理学领域的研究产生了深远的影响。
当前挑战
RODEM Jet Datasets面临着一系列挑战。首先,数据集需要解决的是如何准确模拟并描述大半径喷注的复杂亚结构,以便机器学习算法能够有效地学习和识别不同类型的喷注。其次,在构建过程中,研究人员面临着如何确保数据集的质量和多样性,以便支持各种机器学习应用的问题。此外,数据集的规模和复杂性也对其存储、处理和分析提出了挑战。最后,尽管RODEM Jet Datasets提供了丰富的亚结构信息,但在实际应用中,如何有效地利用这些信息来提高机器学习模型的性能,仍然是需要进一步研究和解决的问题。
常用场景
经典使用场景
RODEM Jet Datasets作为粒子物理领域机器学习算法开发和评估的全面模拟大型径向喷注集合,被广泛应用于喷注分类、异常检测和生成模型构建。数据集覆盖了广泛的喷注源,包括夸克/胶子喷注、来自W玻色子衰变的喷注、顶夸克喷注以及重新物理粒子的喷注,提供了详细的子结构信息,如喷注运动学、组成部分运动学和轨迹位移细节,支持对喷注内部结构的深入研究和分析。
解决学术问题
RODEM Jet Datasets解决了粒子物理中喷注分类和异常检测的难题。通过提供高质量的模拟喷注数据,该数据集使得机器学习模型能够准确捕捉实验中产生的喷注的子结构和特性,从而提高了喷注分类的准确性,并支持了异常检测,这可能表明新型物理现象的存在。此外,该数据集还促进了生成喷注模型的发展,有助于更深入地理解高能过程。
衍生相关工作
基于RODEM Jet Datasets的衍生相关工作包括但不限于开发先进的喷注分类算法、构建生成喷注模型以及进行异常检测。这些工作不仅推动了粒子物理领域的研究进展,也为其他领域提供了有价值的工具和方法。例如,基于RODEM Jet Datasets的喷注分类算法可以应用于其他物理实验中的数据分析,而生成喷注模型则可以用于其他领域的数据生成和模拟。此外,异常检测技术也可以应用于其他领域的异常检测任务,如网络安全和金融欺诈检测。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作