azugarini/CapMIT1003
收藏Hugging Face2024-07-14 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/azugarini/CapMIT1003
下载链接
链接失效反馈官方服务:
资源简介:
CapMIT1003是一个包含标题和点击相关图像探索的数据集,这些数据是在标题任务期间收集的。CapMIT1003基于著名的MIT1003基准,该基准在自由观看条件下提供了人眼跟踪数据,这为同时研究任务下的人类注意力提供了有希望的机会。
CapMIT1003 is a dataset of captions and click-contingent image explorations collected during captioning tasks. CapMIT1003 is based on the same stimuli from the well-known MIT1003 benchmark, for which eye-tracking data under free-viewing conditions is available, which offers a promising opportunity to concurrently study human attention under both tasks.
提供机构:
azugarini
原始信息汇总
CapMIT1003 数据集概述
数据集描述
CapMIT1003 是一个包含字幕和点击条件图像探索的数据集,这些数据是在字幕任务期间收集的。该数据集基于著名的 MIT1003 基准测试中的刺激,该基准测试提供了在自由观看条件下的眼动追踪数据,为同时研究两种任务下的人类注意力提供了机会。
数据集特征
- obs_uid: 字符串类型,观察者唯一标识符。
- usr_uid: 字符串类型,用户唯一标识符。
- caption: 字符串类型,字幕内容。
- image: 图像类型,图像数据。
- clicks_path: 序列类型,包含两个整数,表示点击路径。
- clicks_time: 时间戳序列类型,表示点击时间。
数据集分割
- train: 训练集,包含 3848 个样本,总大小为 1611467 字节。
数据集大小
- 下载大小: 241443505 字节
- 数据集大小: 1611467 字节
引用信息
如果使用该数据集进行研究或工作,请引用以下论文:
@article{zanca2023contrastive, title={Contrastive Language-Image Pretrained Models are Zero-Shot Human Scanpath Predictors}, author={Zanca, Dario and Zugarini, Andrea and Dietz, Simon and Altstidl, Thomas R and Ndjeuha, Mark A Turban and Schwinn, Leo and Eskofier, Bjoern}, journal={arXiv preprint arXiv:2305.12380}, year={2023} }



