five

R2R (Room-to-Room)|自然语言处理数据集|计算机视觉数据集

收藏
Papers with Code2024-05-15 收录
自然语言处理
计算机视觉
下载链接:
https://paperswithcode.com/dataset/room-to-room
下载链接
链接失效反馈
资源简介:
R2R is a dataset for visually-grounded natural language navigation in real buildings. The dataset requires autonomous agents to follow human-generated navigation instructions in previously unseen buildings, as illustrated in the demo above. For training, each instruction is associated with a Matterport3D Simulator trajectory. 22k instructions are available, with an average length of 29 words. There is a test evaluation server for this dataset available at EvalAI.
AI搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
R2R数据集是一个用于视觉基础自然语言导航的数据集,包含22,000条人类生成的导航指令,每条指令平均长度为29个单词,并与Matterport3D模拟器轨迹相关联。数据集支持在未见过的建筑环境中进行导航,并提供了一个测试评估服务器。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
5,000+
优质数据集
54 个
任务类型
进入经典数据集