TOUCHDOWN|计算机视觉数据集|自然语言处理数据集
收藏触地数据集(Touchdown Dataset)
数据集简介
- 触地数据集是一个用于执行导航指令和解析视觉现实世界环境中的空间描述的语料库。
- 任务是遵循指令到达一个目标位置,并在那里找到一个隐藏的物体,即触地熊(Touchdown the bear)。
相关论文
- 论文标题:Touchdown: Natural Language Navigation and Spatial Reasoning in Visual Street Environments
- 作者:Howard Chen, Alane Suhr, Dipendra Misra, Noah Snavely, Yoav Artzi
- 论文链接:https://arxiv.org/abs/1811.12354
- 任务解释及示例视频:https://youtu.be/uCcDbTZs3v4
- 原始导航实验代码:https://github.com/lil-lab/ciff
数据集内容
- 数据集包含触地语料库。
- 导航环境由大量全景图组成。
- 全景图可通过 StreetLearn 环境下载。
- 请求访问全景图像需填写 StreetLearn Dataset 表单。
- 更多细节请见 此处。
数据集目录结构
data/
:包含 JSON 文件train.json
、dev.json
、test.json
。这些是用于导航和空间描述解析(SDR)任务的数据文件。graph/
:包含构建图的 .txt 文件。nodes.txt
包含图中的所有节点。links.txt
包含图中的所有边。
图文件
nodes.txt
:包含四列panoid
、pano_yaw_angle
、latitude
、longitude
links.txt
:包含三列start_panoid
、heading
、end_panoid
JSON 文件结构
- 所有三个文件遵循相同结构,包含以下信息:
路线信息
city
:城市名称route_id
:唯一路线 IDelapsed
:编写此路线指令所花费的时间failure_stats
:指令编写者尝试将触地熊放置在最终位置/全景图上的次数num_finished
:跟随者找到熊的运行次数full_text
:从导航到触地熊放置的完整指令
导航任务
navigation_text
:导航指令文本route_panoids
:从起点到终点的全景图 ID 列表start_heading
:起始航向角度(度)end_heading
:终止航向角度(度)
空间描述解析(SDR)任务
td_location_text
:SDR 指令文本pre_pano
、main_pano
、post_pano
:全景图 ID,main_pano
是放置触地的目标位置全景图 ID。pre_pano
和post_pano
是目标位置前后全景图pre_static_center
、main_static_center
、post_static_center
:触地放置位置的点击位置{x: width_ratio, y: height_ratio}
,{x: -1, y: -1}
表示触地熊在全景图中找不到
实验复现代码
许可
- 触地数据集(c)2018
- 触地数据集根据 Creative Commons Attribution 4.0 国际许可 授权。

学生课堂行为数据集 (SCB-dataset3)
学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。
arXiv 收录
FER2013
FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。
github 收录
Materials Project
材料项目是一组标有不同属性的化合物。数据集链接: MP 2018.6.1(69,239 个材料) MP 2019.4.1(133,420 个材料)
OpenDataLab 收录
URPC系列数据集, S-URPC2019, UDD
URPC系列数据集包括URPC2017至URPC2020DL,主要用于水下目标的检测和分类。S-URPC2019专注于水下环境的特定检测任务。UDD数据集信息未在README中详细描述。
github 收录
用于陆面模拟的中国土壤数据集(第二版)
本研究对中国范围内0-2米六个标准深度层(0-5、5-15、15-30、30-60、60-100和100-200厘米)的23种土壤物理和化学属性进行了90米空间分辨率的制图。该数据集源自第二次土壤普查的8979个土壤剖面,世界土壤信息服务的1540个土壤剖面,第一次全国土壤普查的76个土壤剖面,以及区域数据库的614个土壤剖面。该数据集包括pH值、砂粒、粉粒、粘粒、容重、有机碳含量、砾石、碱解氮、总氮、阳离子交换量、孔隙度、总钾、总磷、有效钾、有效磷和土壤颜色(包括蒙赛尔颜色和RGB两种形式)。数据集的缺失值为“fillvalue = -32768”。数据集以栅格格式提供,有Tiff和netCDF两种格式。为了满足陆面建模中不同应用对空间分辨率的不同要求,CSDLv2 提供了 90 米、1 公里和 10公里空间分辨率的版本。各个土壤属性的单位参见说明文档。该数据集相对于第一版具有更好的数据质量,可广泛应用于陆面过程模拟等地学相关研究。
国家青藏高原科学数据中心 收录