five

PET

收藏
arXiv2022-06-13 更新2024-06-21 收录
下载链接:
https://pdi.fbk.eu/pet-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
PET数据集是由Bruno Kessler基金会和合作伙伴共同创建,专注于从自然语言文本中提取业务流程模型。该数据集包含45个文本描述,每个描述都经过精心标注,涵盖活动、网关、参与者及流程信息。创建过程中,首先对文本进行预处理和标注,随后通过自动化工具修正标注错误,并计算专家标注的一致性。PET数据集的应用领域主要集中在业务流程管理和信息提取,旨在通过提供高质量的标注数据,推动数据驱动的方法在业务流程提取中的应用,并促进不同方法之间的客观比较。

The PET Dataset was co-created by the Bruno Kessler Foundation and its partners, focusing on extracting business process models from natural language texts. This dataset contains 45 text descriptions, each meticulously annotated with information covering activities, gateways, participants and process details. During its development, texts were first preprocessed and annotated, followed by correction of annotation errors via automated tools and calculation of inter-annotator agreement among experts. The PET Dataset is mainly applied in the fields of business process management and information extraction. It aims to promote the application of data-driven approaches in business process extraction by providing high-quality annotated data, and facilitate objective comparisons between different methods.
提供机构:
Bruno Kessler基金会
创建时间:
2022-03-10
搜集汇总
数据集介绍
main_image_url
构建方式
在计算机视觉与认知科学交叉领域,PET数据集的构建体现了对眼动数据采集方法的系统性探索。该数据集基于Pascal VOC 2012图像集,精心选取了鸟、猫、牛、狗、马和羊这六类动物图像作为视觉刺激材料,共计4135张。实验招募了40名参与者,采用Tobii桌面眼动仪以120赫兹采样频率记录其眼动轨迹。每位参与者在自由观看和视觉搜索两种任务条件下观察图像,每张图像呈现时长为2秒,确保了每种条件下每张图像获得四条独立的眼动轨迹。数据预处理阶段剔除了无效坐标及首帧注视点,最终得到自由观看条件下的28733个注视点与视觉搜索条件下的29901个注视点,为后续分析提供了高质量的数据基础。
特点
PET数据集的显著特征在于其同时囊括了自由观看与视觉搜索两种实验范式下的眼动记录,这为探究任务导向对视觉注意机制的影响提供了独特视角。数据集涵盖的六类动物目标在Pascal VOC数据集中因形态与纹理变化显著而检测难度较高,使得该数据具有重要的研究价值。分析表明,尽管两种任务条件下观察者的扫视延迟与注视持续时间存在统计学差异,且视觉搜索任务下的眼动模式更为紧凑,但目标物体上的注视点比例与覆盖目标数量在两种条件下高度相似。这一发现揭示了在利用注视点训练目标检测模型时,两种范式可能具有等效性。
使用方法
PET数据集的核心应用在于通过注视点引导的特征池化来提升目标分类性能。具体而言,研究者可在图像中每个注视点周围30×30像素的窗口内,对SIFT特征进行空间池化操作,替代传统的全图均匀采样或固定空间金字塔划分。实验证明,基于注视点的最大池化策略,尤其在视觉搜索任务获取的注视点基础上,能够有效提升稀疏编码分类框架下对六类动物的平均识别准确率。该数据集为探索如何将人类注视先验知识融入计算机视觉模型提供了实证平台,适用于视觉注意建模、目标检测与分类算法的增强研究。
背景与挑战
背景概述
在计算机视觉与认知科学交叉领域,利用眼动追踪数据提升场景理解能力已成为前沿研究方向。PET(Pascal动物类别眼动追踪数据库)于2016年由国际研究团队联合创建,核心成员包括Syed Omer Gilani、Ramanathan Subramanian、Yan Yan等学者。该数据集聚焦于Pascal VOC 2012图像集中的六类动物目标(鸟、猫、牛、狗、马、羊),通过记录40名参与者在自由观看与视觉搜索两种任务条件下的眼动轨迹,旨在探究任务范式对眼动行为的影响,并推动基于注视点的物体检测与分类方法发展。其创新性在于首次系统比较了两种眼动采集范式在目标检测任务中的效用,为融合人类认知先验的机器学习模型提供了珍贵实验数据。
当前挑战
PET数据集致力于解决动物类别物体检测与分类的挑战,此类目标因形态与纹理差异巨大,传统监督学习方法表现受限。构建过程中,研究团队需克服多重困难:在实验设计上,需平衡自由观看与视觉搜索任务的顺序效应,避免认知偏差;在数据采集环节,需确保眼动仪校准精度与时间窗口控制的稳定性,以获取可靠注视点序列;在数据分析层面,需开发多维度评估指标(如扫视延迟、复发量化分析),以量化两种任务范式下眼动模式的细微差异。此外,如何将离散注视点有效转化为空间特征池化机制,以提升分类模型性能,亦是该数据集应用中的核心挑战。
常用场景
经典使用场景
在计算机视觉与认知科学交叉领域,PET数据集为研究者提供了探究视觉注意机制与目标检测关联的宝贵资源。该数据集最经典的使用场景在于对比自由观看与视觉搜索两种任务范式下的眼动模式差异。通过分析四十名观察者对Pascal VOC 2012数据集中六类动物图像的眼动轨迹,研究者能够深入理解任务需求如何系统性影响视觉注意的分配策略,从而为构建更符合人类认知规律的计算机视觉模型奠定实证基础。
解决学术问题
PET数据集有效解决了视觉注意建模中任务范式影响量化不足的学术难题。传统眼动研究虽已确认任务对注视模式存在影响,但缺乏在具体目标检测场景下的系统比较。该数据集通过并行采集自由观看与视觉搜索条件下的眼动数据,首次实证揭示了两种范式在目标注视比例上的相似性,同时量化了搜索任务在缩短扫视潜伏期、增强注视轨迹紧凑性方面的优势。这一发现弥合了认知心理学与计算机视觉领域的理论间隙,为基于注视点的目标检测算法提供了关键设计依据。
衍生相关工作
PET数据集的发布催生了多个眼动计算领域的经典研究脉络。在算法层面,后续工作扩展了基于注视点的弱监督目标检测框架,如利用注视聚类生成候选区域的方法。在认知建模方向,研究者结合该数据集发展了任务驱动的视觉注意预测模型,将高层语义任务纳入计算建模。数据集构建范式本身也影响了后续多模态数据采集标准,促使MIT Saliency Benchmark等平台纳入任务条件变量。这些衍生工作共同推动了从被动记录到主动利用眼动信号的研究范式转变。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作