five

Localized Narratives

收藏
arXiv2025-09-30 收录
下载链接:
https://google.github.io/localized-narratives/
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含了84.9万张图片,每张图片都附有与描述中的每个单词对齐的鼠标轨迹注释,展现了视觉注意力与语言描述之间的关系。此外,该项目涉及了156位专业标注人员,在名词和动词上的语义准确度达到了98.0%。同时,还分析了鼠标轨迹与物体位置之间的准确性。该数据集的规模达到了84.9万张已标注的图片,其任务是对视觉语言模型中的视觉注意力进行鼠标轨迹注释。

This dataset contains 849,000 images, each paired with mouse trajectory annotations aligned to every word in its accompanying description, which elucidates the relationship between visual attention and linguistic descriptions. The project recruited 156 professional annotators, achieving a semantic accuracy of 98.0% for both nouns and verbs. Additionally, the alignment accuracy between mouse trajectories and object positions was evaluated. With a total of 849,000 annotated images, this dataset is dedicated to the task of annotating visual attention in vision-language models via mouse trajectories.
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
Localized Narratives是一个连接视觉和语言的多模态图像标注数据集,包含849k张图像的标注,标注信息包括同步的语音描述、鼠标轨迹和语音录音。数据集覆盖了多个公开数据集,标注格式为JSON Lines,便于下载和使用。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作