SightationReasoning
收藏Hugging Face2025-03-13 更新2025-03-14 收录
下载链接:
https://huggingface.co/datasets/Sightation/SightationReasoning
下载链接
链接失效反馈官方服务:
资源简介:
SightationReasoning数据集是一个包含 diagrams 描述和推理问答对的数据集,适用于视觉障碍用户的视觉辅助。该数据集通过 sighted 用户对视觉语言模型生成的 diagrams 描述的评估构建而成,旨在辅助专业教育者进行视觉障碍学生的学习。数据集包括1000个 diagram 图像和两种类型的描述,以及从中提取的推理路径和推理问答对。
The SightationReasoning dataset is a collection of diagram descriptions and reasoning-based question-answer pairs designed for visual assistance to visually impaired users. This dataset is constructed through evaluations by sighted users of diagram descriptions generated by visual language models, with the goal of aiding professional educators in supporting the learning of visually impaired students. The dataset encompasses 1000 diagram images, two types of descriptions, alongside extracted reasoning paths and reasoning-based question-answer pairs derived from these resources.
创建时间:
2025-03-11
搜集汇总
数据集介绍

构建方式
SightationReasoning数据集的构建是通过集合 sighted 用户对由视觉语言模型(VLM)生成的图表描述进行评估的方式进行的。该数据集的描述和推理路径是从基本提示和引导生成提示中提取的,并包含了五种不同类型的推理问答对,这些问答对是从描述中提取的,用以涵盖因果关系、过程、条件、解释和反向推理等不同类型的推理任务。
使用方法
使用SightationReasoning数据集时,用户可以依据数据集提供的图像、描述、推理路径和推理问答对进行各种下游任务训练,如问答系统、推理模型等。数据集分为训练集,方便用户进行模型的训练和微调。用户可以从HuggingFace的存储库中下载该数据集,并根据自身的需求进行相应的数据处理和模型训练。
背景与挑战
背景概述
SightationReasoning数据集的研究背景源于对盲人和低视力(BLV)用户在视觉描述方面的特殊需求。该数据集由专业研究人员创建于近期,旨在通过视觉语言模型(VLM)的辅助,结合 sighted 用户反馈,构建一个与BLV用户需求相符合的图表描述数据集。该数据集包含5000个图表和137000个样本,可用于完善、偏好、检索、问答和推理训练等多种下游任务。研究团队通过本数据集,探索了视觉障碍学习者在教育领域的需求,并展示了数据集在多种任务中的微调潜力。
当前挑战
在构建SightationReasoning数据集的过程中,研究人员面临了多重挑战。首先,如何确保 sighted 注解者的描述能够满足BLV用户的标准,而非仅仅停留在视觉描述的层面,是一个关键问题。其次,数据集在构建过程中需要处理如何有效提取和分类图表中的因果关系、步骤过程、现象解释等推理路径信息,以及如何从描述中提取高质量的问答对以适应推理下游任务的需求。此外,还需克服数据偏差和成本效率等问题,以确保数据集的质量和实用性。
常用场景
经典使用场景
SightationReasoning数据集被广泛应用于视觉辅助技术领域,其经典使用场景在于辅助视觉障碍用户理解图表信息。通过将图表描述与推理路径及问题回答相结合,该数据集能够为视觉障碍用户提供详尽的图表内容解释,从而促进其独立获取知识。
解决学术问题
该数据集解决了视觉障碍用户在获取图表信息时面临的困难,通过图表描述与推理路径的融合,有效提升了视觉语言模型对图表内容的解释能力。其研究成果有助于克服视觉障碍用户在学术研究中的信息获取障碍,对教育平等及特殊教育领域具有重要意义。
实际应用
在实际应用中,SightationReasoning数据集可被用于开发辅助教育工具,如为视觉障碍学生设计的个性化学习系统。此外,该数据集亦可用于提升视觉语言模型的推理能力,进而提高机器辅助决策的准确性和效率。
数据集最近研究
最新研究方向
SightationReasoning数据集聚焦于构建盲人和低视力用户适用的图表描述,其最新研究方向涉及利用视觉模型和视觉反馈来生成更符合BLV标准的描述。该数据集通过专业教育者评估视觉语言模型生成的描述,进而优化图表描述的生成过程。研究不仅关注描述的生成,更深入探索了描述中的因果关系、过程、条件、解释以及逆向推理等逻辑路径,并从中提炼出相应的问答对。这一研究对于推动视觉辅助技术在教育领域的应用具有重要意义,特别是在提升视觉障碍学习者的学习体验方面。
以上内容由遇见数据集搜集并总结生成



