xiang709/VRSBench|遥感图像理解数据集|视觉-语言模型数据集
收藏VRSBench 数据集概述
数据集基本信息
- 许可证: Creative Commons Attribution Non Commercial 4.0
- 任务类别: 视觉问答、文本生成
- 语言: 英语
- 名称: VRSBench
- 大小类别: 10K<n<100K
- 标签: 遥感、视觉语言模型
数据集内容
- 图像数量: 29,614 张遥感图像
- 对象标注: 52,472 个对象标注
- 视觉问答对: 312,221 对
数据集构建
- 属性提取: 从现有对象检测数据集中提取图像和对象信息。
- 提示工程: 设计指令以提示 GPT-4V 生成详细的图像标题、对象引用和问答对。
- GPT-4 推理: 使用 OpenAI API 自动生成图像标题、对象引用和问答对。
- 人工验证: 通过人工标注者验证 GPT-4V 生成的每个标注。
模型训练
- 基准模型: LLaVA-1.5, MiniGPT-v2, Mini-Gemini, GeoChat
- 微调: 在 RSVBench 数据集上对每个模型进行 5 个周期的微调,使用 LoRA 微调,秩为 64。
数据集影响
- 社会影响: 支持高级视觉语言模型的训练和评估,提升其在遥感中的应用能力。
- 偏见讨论: 尽管通过人工验证确保高质量标注,但视觉数据的解释可能存在主观偏见。
- 其他已知限制: 地理多样性受限于 DOTA-v2 和 DIOR 数据集覆盖的区域。
许可证信息
- 许可证: Creative Commons Attribution Non Commercial 4.0
未来工作
- 扩展计划: 计划将 VRSBench 扩展到包括红外图像、多光谱和超光谱图像、合成孔径雷达(SAR)图像和时间数据集在内的多种遥感数据类型。
引用信息
bibtex @misc{li2024vrsbench, title={VRSBench: A Versatile Vision-Language Benchmark Dataset for Remote Sensing Image Understanding}, author={Xiang Li, Jian Ding, Mohamed Elhoseiny}, year={2024}, eprint={xxx}, archivePrefix={arXiv}, primaryClass={cs.CV} }

China Health and Nutrition Survey (CHNS)
China Health and Nutrition Survey(CHNS)是一项由美国北卡罗来纳大学人口中心与中国疾病预防控制中心营养与健康所合作开展的长期开放性队列研究项目,旨在评估国家和地方政府的健康、营养与家庭计划政策对人群健康和营养状况的影响,以及社会经济转型对居民健康行为和健康结果的作用。该调查覆盖中国15个省份和直辖市的约7200户家庭、超过30000名个体,采用多阶段随机抽样方法,收集了家庭、个体以及社区层面的详细数据,包括饮食、健康、经济和社会因素等信息。自2011年起,CHNS不断扩展,新增多个城市和省份,并持续完善纵向数据链接,为研究中国社会经济变化与健康营养的动态关系提供了重要的数据支持。
www.cpc.unc.edu 收录
LANDSLIDE DETECTION
该数据集专注于山体滑坡现象的识别与分类,旨在为改进YOLOv8模型提供高质量的训练数据。数据集包含1600幅图像,类别数量为1,具体类别为“LANDSLIDE”。数据集的构建考虑了山体滑坡的多样性与复杂性,确保模型在实际应用中具备良好的泛化能力。
github 收录
VEDAI
用于训练YOLO模型的VEDAI数据集,包含图像和标签,用于目标检测和跟踪。
github 收录
UAVDT Dataset
The authors constructed a new UAVDT Dataset focused on complex scenarios with new level challenges. Selected from 10 hours raw videos, about 80, 000 representative frames are fully annotated with bounding boxes as well as up to 14 kinds of attributes (e.g., weather condition, flying altitude, camera view, vehicle category, and occlusion) for three fundamental computer vision tasks: object detection, single object tracking, and multiple object tracking.
datasetninja.com 收录
GREAT Dataset
我们提出了GREAT数据集:一个从复杂城市环境中车辆搭载平台收集的新型多传感器原始观测数据集,具有高精度多频GNSS接收器、战术级IMU、MEMS IMU、两个CMOS相机和LiDAR。所有这些传感器实现了硬件级别的时间同步,并且它们的时空关系得到了良好的校准。该数据集包括八个序列,涵盖武汉大学校园和城市郊区的环境。该数据集旨在评估各种多传感器融合导航算法的性能。
github 收录