five

"Extra Figure u8cw[Z408] (corr)" of "Study of quark and gluon jet substructure in Z+jet and dijet events from pp collisions"|高能物理数据集|喷注物理数据集

收藏
Mendeley Data2024-01-31 更新2024-06-27 收录
高能物理
喷注物理
下载链接:
https://www.hepdata.net/record/112754
下载链接
链接失效反馈
资源简介:
Measurements of jet substructure describing the composition of quark- and gluon-initiated jets are presented. Proton-proton (pp) collision data at sqrt(s)=13 TeV collected with the CMS detector are used, corresponding to an integrated luminosity of 35.9/fb. Generalized angularities are measured that characterize the jet substructure and distinguish quark- and gluon-initiated jets. These observables are sensitive to the distributions of transverse momenta and angular distances within a jet. The analysis is performed using a data sample of dijet events enriched in gluon-initiated jets, and, for the first time, a Z+jet event sample enriched in quark-initiated jets. The observables are measured in bins of jet transverse momentum, and as a function of the jet radius parameter. Each measurement is repeated applying a "soft drop" grooming procedure that removes soft and large angle radiation from the jet.For easier navigation, figures are named with a code with each letter/number representing in the following order: ungroomed/groomed, AK4/AK8, charged, multiplicity/pTD2/thrust/width/LHA, [central dijet/forward dijet/Z+jet, PT].
创建时间:
2024-01-31
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

Nexdata/chinese_dialect

该数据集包含25,000小时的中文方言语音数据,收集自多个方言区域的本地方言使用者,涵盖闽南语、粤语、四川话、河南话、东北话、上海话、维吾尔语和藏语等。数据格式为16kHz、16bit、未压缩的wav文件,单声道。句子准确率超过95%。数据集支持的任务包括自动语音识别(ASR)和音频说话人识别。

hugging_face 收录

CE-CSL

CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。

arXiv 收录

TCM-SD

TCM-SD数据集是首个公开的大规模证型辨识基准,由北京理工大学计算机科学与技术学院创建。该数据集包含54,152条真实世界的临床记录,涵盖148种证型,旨在通过自然语言处理技术推动中医理论的实证研究。数据集的创建过程涉及从网站爬取大量未标记文本,构建中医领域特定的预训练语言模型ZY-BERT。TCM-SD数据集的应用领域主要集中在中医诊断与治疗系统中,特别是证型辨识任务,以解决中医领域数据驱动AI技术的进一步发展需求。

arXiv 收录

MultiTalk

MultiTalk数据集是由韩国科学技术院创建,包含超过420小时的2D视频,涵盖20种不同语言,旨在解决多语言环境下3D说话头生成的问题。该数据集通过自动化管道从YouTube收集,每段视频都配有语言标签和伪转录,部分视频还包含伪3D网格顶点。数据集的创建过程包括视频收集、主动说话者验证和正面人脸验证,确保数据质量。MultiTalk数据集的应用领域主要集中在提升多语言3D说话头生成的准确性和表现力,通过引入语言特定风格嵌入,使模型能够捕捉每种语言独特的嘴部运动。

arXiv 收录

MAV-VID, Drone-vs-Bird, Anti-UAV

本研究涉及三个数据集:MAV-VID、Drone-vs-Bird和Anti-UAV,总计包含241个视频,共计331,486张图像。这些数据集由杜伦大学创建,用于无人机视觉检测和跟踪的研究。数据集内容丰富,包括从地面和无人机搭载的摄像头捕获的图像,涵盖了多种环境和条件。创建过程中,数据集经过精心标注和处理,以确保数据质量。这些数据集主要用于评估和改进无人机检测和跟踪技术,特别是在复杂环境和动态场景中的应用。

arXiv 收录