blv_eye4b
收藏Hugging Face2025-03-26 更新2025-03-27 收录
下载链接:
https://huggingface.co/datasets/brl-xfact/blv_eye4b
下载链接
链接失效反馈官方服务:
资源简介:
Eye4B数据集是一个经过人类验证的图像请求-LVLM响应数据集,包含了BLV(盲人和低视力)偏好分数注释。该数据集可用于评估LVLM(低视力语言模型)响应以及自动指标是否能够捕捉到盲人和低视力个体在导航辅助方面的潜在偏好。
创建时间:
2025-03-25
搜集汇总
数据集介绍

构建方式
在辅助技术研究领域,blv_eye4b数据集通过严谨的实证研究构建而成。研究团队收集了盲人和低视力群体在导航辅助场景中的实际需求,采用人类验证方法对多模态大语言模型生成的响应进行标注。数据集包含98组经过专业评分的测试样本,每组数据由图像路径、用户请求、模型响应及偏好评分构成,评分维度包括总体得分和平均得分两个量化指标。
特点
该数据集的核心价值体现在其独特的标注视角和专业性。作为首个关注视障群体偏好的评估基准,blv_eye4b提供了经过严格验证的人类评分数据,能够客观反映盲人和低视力用户对导航辅助系统的真实需求。数据集包含多维评分体系,既包含整体评价的overall_score,也包含细粒度评估的avg_score,为研究多模态模型在无障碍技术领域的适应性提供了可靠依据。
使用方法
研究人员可通过该数据集开展两方面的评估工作:一方面可测试多模态大语言模型生成的导航辅助响应是否符合视障用户偏好,另一方面能验证自动评价指标与人类偏好的对齐程度。使用时需加载包含图像路径、文本请求和模型响应的三元组数据,结合标注的偏好分数进行定量分析。数据集采用标准化结构存储,支持直接调用HuggingFace接口进行加载和处理。
背景与挑战
背景概述
由Na Min An等研究人员于2025年发布的Eye4B数据集,致力于探索低视力与盲人群体(BLV)在导航辅助场景中的偏好识别问题。作为计算机视觉与无障碍技术交叉领域的前沿研究,该数据集通过收集经人工验证的图像-请求-大视觉语言模型(LVLM)响应三元组,并标注BLV偏好评分,为评估模型输出的实用性和包容性提供了基准。其核心价值在于推动辅助技术从功能实现向用户体验优化的范式转变,相关成果发表于计算机视觉顶刊arXiv,标志着人机交互研究向弱势群体需求倾斜的重要进展。
当前挑战
该数据集面临双重技术挑战:在领域问题层面,如何准确捕捉BLV群体对导航辅助信息的非线性偏好模式,这要求突破传统视觉描述任务中以明眼用户为中心的评价体系;在构建过程中,需解决多模态数据对齐的复杂性,包括图像路径、自然语言请求与LVLM响应的语义关联,以及通过众包平台获取高质量BLV专家标注时面临的样本偏差控制问题。这些挑战本质上反映了无障碍AI领域模型评估框架与真实用户需求之间的鸿沟。
常用场景
经典使用场景
在计算机视觉与辅助技术交叉领域,blv_eye4b数据集为评估大型视觉语言模型(LVLM)的导航辅助响应质量提供了基准平台。该数据集通过包含盲人和低视力群体(BLV)的真实偏好评分,使研究者能够系统分析模型生成描述与人类实际需求之间的对齐程度,特别适用于验证导航指引的准确性、情感共鸣及实用性等维度。
实际应用
实际应用中,该数据集可直接优化智能导航助手的开发流程。科技公司可基于BLV群体的偏好数据微调LVLM,生成更符合视障人士认知习惯的环境描述。公共设施管理机构亦可利用此类评估结果,改进室内外导航系统的语音提示设计,切实提升特殊群体的独立出行体验。
衍生相关工作
围绕该数据集衍生的研究已延伸至多个方向,包括基于偏好得分的LVLM强化学习框架、无障碍导航的跨模态对齐算法等。其标注范式更启发了后续工作如BLV-CARE基准的构建,推动了包容性人工智能评估体系的标准化进程。
以上内容由遇见数据集搜集并总结生成



