five

RussRobin/SpatialQA

收藏
Hugging Face2024-07-19 更新2024-07-06 收录
下载链接:
https://hf-mirror.com/datasets/RussRobin/SpatialQA
下载链接
链接失效反馈
官方服务:
资源简介:
SpatialQA数据集旨在通过帮助模型理解和利用深度图来增强其空间理解能力。该数据集包含SpatialQA.json文件和高分辨率图像,同时需要从Bunny_695k下载低分辨率和中分辨率图像。

The SpatialQA dataset enhances the models spatial understanding capabilities by helping it comprehend and utilize depth maps. The dataset includes SpatialQA.json and high-level images, with additional low and middle-level images available in the Bunny_695k dataset. The dataset size is between 10,000 and 100,000 entries and is part of a broader initiative involving a GitHub repository, a VLM model with precise depth understanding, and a spatial understanding benchmark.
提供机构:
RussRobin
原始信息汇总

SpatialQA 数据集概述

基本信息

  • 许可证: CC BY 4.0
  • 语言: 英语
  • 标签:
    • Spatial Intelligence
    • Depth Understanding
    • Vision Language Model
    • Multi-modal Large Language Model
  • 名称: SpatialQA
  • 数据量: 10K < n < 100K

数据集内容

  • 文件: SpatialQA.json
  • 图像: 包含高层次图像,需额外下载低层次和中层次图像,链接为 Bunny_695k

相关资源

搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
RussRobin/SpatialQA是一个用于增强空间理解能力的多模态数据集,包含图像和深度图数据,适用于视觉问答任务。数据集需要配合Bunny_695k图像使用,并提供了相关模型和论文资源。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作