PathoGaze1.0
收藏arXiv2025-10-29 更新2025-10-30 收录
下载链接:
https://osf.io/hj9a7
下载链接
链接失效反馈官方服务:
资源简介:
PathoGaze1.0是一个综合性的行为数据集,记录了19名病理学家在癌症诊断过程中完整的诊断工作流程中的动态视觉搜索和决策过程。该数据集包含从19名病理学家解释397个WSIs中收集的18.69小时的眼睛追踪、鼠标交互、刺激追踪、视口导航和诊断决策数据(EMSVD)。此外,这些数据还可以用于提高病理学家和可能支持人类专家的AI系统的训练。
PathoGaze 1.0 is a comprehensive behavioral dataset that captures the dynamic visual search and decision-making processes of 19 pathologists throughout their complete cancer diagnostic workflow. This dataset contains 18.69 hours of eye tracking, mouse interaction, stimulus tracking, viewport navigation, and diagnostic decision-making data (EMSVD) collected from 19 pathologists who interpreted 397 WSIs. Furthermore, this dataset can be used to enhance the training of both pathologists and AI systems that may support human experts.
提供机构:
俄亥俄州立大学计算机科学与工程学院
创建时间:
2025-10-29
搜集汇总
数据集介绍

构建方式
PathoGaze1.0数据集通过应用导向的测试平台PTAH构建,模拟真实临床诊断环境,整合眼动追踪、鼠标交互和视口导航数据。该平台采用Tobii Pro Fusion眼动仪,在120Hz和60Hz采样率下记录19位病理学家解读397张全切片图像的行为,涵盖171,909次注视和263,320次扫视事件。实验设计分为两部分:实验I聚焦10位专家对60张相同切片的行为一致性分析,实验II由9位专家分别解读397张切片以扩大行为覆盖范围。所有数据经过坐标系统一转换,确保眼动、鼠标与图像空间数据的精确对齐。
特点
该数据集的核心特点在于其多模态行为记录的全面性,同步捕获视觉搜索、交互导航与诊断决策的完整工作流。数据包含四种肿瘤规模分类(良性、孤立肿瘤、微转移、宏转移),并标注了组织区域与背景的精确分割。通过时间戳对齐技术,实现了注视点与鼠标移动轨迹的毫秒级同步,有效揭示了“视而不见”等典型诊断错误模式。此外,数据集遵循FAIR原则存储,提供原始数据与衍生指标的双重结构,支持从微观注视动力学到宏观诊断策略的多层次分析。
使用方法
研究者可通过公开仓库获取分层结构的数据文件,包括独立眼动数据、鼠标轨迹及融合感知-行为数据集。使用前需加载坐标转换脚本,将屏幕坐标映射至千兆像素级全切片图像空间。分析时可结合提供的51项眼动指标(如注视时长、扫视峰值速度),通过肿瘤掩膜数据量化注视点与病变区域的空间关系。该数据集适用于诊断一致性研究、人机交互建模、视觉搜索认知机制探索,以及AI辅助诊断系统的行为验证训练。
背景与挑战
背景概述
数字病理学领域面临诊断一致性与准确性的核心挑战,病理学家对十亿像素级全切片图像的诊断准确率平均仅为70%。为解析这一难题,俄亥俄州立大学与哈佛医学院的研究团队于2025年联合发布了PathoGaze1.0数据集,通过整合眼动追踪、鼠标交互与视口导航等多模态行为数据,首次系统性记录了19位病理学家在397张乳腺癌淋巴结切片诊断过程中的动态认知行为。该数据集依托临床诊断平台PTAH构建,累计采集18.69小时行为数据,为揭示视觉搜索错误机制与开发人工智能辅助系统提供了关键实证基础。
当前挑战
该数据集致力于解决数字病理诊断中视觉搜索与决策不一致的核心问题,其挑战在于解析十亿像素级图像中'视而不见'的认知偏差与早期满足现象。构建过程中需克服多坐标系统同步的技术难题,包括眼动仪屏幕坐标与全切片图像坐标的实时映射,以及120Hz眼动数据与鼠标事件的毫秒级对齐。此外,保持生态效度要求实验环境完全模拟临床诊断场景,同时需处理不同经验层级病理学家行为模式的显著差异,确保数据能有效支撑跨学科研究。
常用场景
经典使用场景
在数字病理学领域,PathoGaze1.0数据集通过整合眼动追踪、鼠标交互与视口导航数据,系统记录了病理学家在分析千兆像素级全切片图像时的动态视觉搜索行为。该数据集最经典的应用场景在于揭示专家在癌症诊断过程中如何分配注意力资源,例如通过扫描路径分析识别出早期满足或目标遗漏等认知偏差,为理解诊断不一致性提供了实证基础。
衍生相关工作
该数据集已衍生出多项经典研究,例如基于扫描路径聚类构建视觉搜索效率评估指标,以及开发联合注意力预测模型。有研究利用其多模态特性建立了眼动-鼠标行为关联规则,为跨平台诊断行为标准化提供依据。此外,数据集中标注的首末注视点时序信息,催生了关于决策形成机制的认知计算模型,推动了视觉诊断专家系统的迭代发展。
数据集最近研究
最新研究方向
在数字病理学领域,PathoGaze1.0数据集正推动视觉行为与诊断决策的深度融合研究。前沿方向聚焦于利用眼动追踪和鼠标交互数据解析病理学家在千兆像素全切片图像中的注意力分配模式,揭示诊断不一致性的认知根源。热点事件包括开发机器学习模型以模拟人类专家的视觉搜索策略,并探索眼动与鼠标行为的相关性,为构建病理诊断数字孪生系统提供实证基础。该数据集通过整合多模态行为数据,显著提升了病理诊断错误分析的精度,对优化人工智能辅助系统和病理学家培训流程具有深远影响。
相关研究论文
- 1Eye-Tracking, Mouse Tracking, Stimulus Tracking,and Decision-Making Datasets in Digital Pathology俄亥俄州立大学计算机科学与工程学院 · 2025年
以上内容由遇见数据集搜集并总结生成



