five

Surgery-R1-54k

收藏
arXiv2025-09-30 收录
下载链接:
https://github.com/FiFi-HAO467/Surgery-R1
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为Surgery-R1-54k,包含了视觉问答、定位问答以及思维链(CoT)的配对数据,旨在提升对手术场景理解中的推理能力。该数据集基于EndoVis-18-VQLA和EndoVis-17-VQLA数据集构建,并使用qwen2.5-vl-72b-instruct API生成,同时经过专家评审确保准确性。数据集规模包括12,255个完整的思维链、33,342个视觉问答对以及8,902个定位问答对。其任务定位于视觉问题定位回答(Surgical-Vqla)。

This dataset, named Surgery-R1-54k, encompasses paired data for visual question answering (VQA), localization question answering, and chain-of-thought (CoT), aiming to enhance reasoning capabilities in surgical scene understanding. It is constructed based on the EndoVis-18-VQLA and EndoVis-17-VQLA datasets, generated via the qwen2.5-vl-72b-instruct API, and validated by expert reviews to ensure its accuracy. The dataset comprises 12,255 complete chain-of-thought samples, 33,342 VQA pairs, and 8,902 localization question answering pairs. It is tailored for the visual question localization answering task, designated as Surgical-VQLA.
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作