five

SCOUT|人机交互数据集|机器人技术数据集

收藏
arXiv2023-10-27 更新2024-07-24 收录
人机交互
机器人技术
下载链接:
https://github.com/USArmyResearchLab
下载链接
链接失效反馈
资源简介:
SCOUT数据集,由美国陆军研究实验室创建,专注于多模态人机交互在远程探索任务中的应用。该数据集包含10个参与者的交互记录,涉及自然语言指令、文本反馈、2D LIDAR地图和按需静态照片。创建过程中,参与者通过多种模态与机器人合作探索未知环境,旨在通过多模态通信提高任务执行效率和准确性。SCOUT数据集的应用领域包括机器人导航、环境探索和物体识别,特别适用于研究人机协作策略和通信模态的优化。
提供机构:
美国陆军研究实验室
创建时间:
2023-10-27
AI搜集汇总
数据集介绍
main_image_url
构建方式
SCOUT数据集的构建方式是在一个模拟人类与机器人协作探索未知区域的实验环境中进行的。参与者通过语音向机器人发出指令,并从机器人那里接收文本反馈、持续更新的2D LIDAR地图和按需静态照片。这些数据记录了人类在多模态通信环境下探索和完成任务的行为和策略。
特点
SCOUT数据集的特点在于其多模态通信的丰富性。它包含了人类与机器人在探索任务中的对话数据、按需照片和LIDAR地图。这些数据能够帮助研究者分析人类如何利用不同模态的信息来完成任务,并了解不同策略对任务成功的影响。
使用方法
使用SCOUT数据集的方法包括分析对话内容、照片和LIDAR地图之间的关系,以及不同策略对任务成功的影响。研究者可以使用统计方法,如多元回归,来检验假设,并发现人类在多模态通信环境中的行为模式。此外,SCOUT数据集还可以用于训练和评估机器人在多模态通信环境中的表现。
背景与挑战
背景概述
在远程环境中,人类引导的机器人探索是一种获取信息的有用方法,尤其是在那些对人类来说可能太危险、不友好或无法到达的地方。在远程位置的合作伙伴之间保持共同点是一项挑战,这可以通过多模态通信来促进。在这项研究中,我们探索了参与者如何利用多种模态,在机器人合作伙伴的帮助下调查远程位置。参与者发布了口语自然语言指令,并从机器人那里获得了基于文本的反馈、连续的2D LIDAR映射和按需的静态照片。我们注意到在模态的使用方面采取了不同的策略,并假设这些差异可能与探索子任务的成败相关。我们发现请求照片可能有助于识别和计数某些关键实体(特别是门道),并且这种策略并没有妨碍整体区域的探索。未来使用更大样本的工作可能会揭示更细致的照片和对话策略的影响,这些策略可以告知机器人代理的训练。此外,我们还宣布发布我们独特的多模态人类-机器人通信语料库:SCOUT,即理解事务的情境语料库。
当前挑战
构建SCOUT数据集的过程中,研究人员面临了多个挑战。首先,由于远程合作伙伴之间的共同点难以维持,因此需要通过多模态通信来促进。其次,在探索和搜索任务中,参与者需要利用三种资源:机器人、地图和照片,这需要他们有效地使用语言、LIDAR和照片三种模态。此外,由于实验设计的选择,收集的数据可能无法推广。例如,由于光线不足,图像可能对最先进的计算机视觉算法构成挑战。最后,尽管参与者可以使用语言模态与机器人进行交互,但他们无法从机器人的视角获得实时流媒体视觉信息,这可能导致缺乏共同点。
常用场景
经典使用场景
SCOUT数据集主要应用于人机协作的探索场景,特别是在危险、不适宜居住或难以到达的远程地点。参与者通过自然语言指令与机器人进行交流,并接收来自机器人的文本反馈、连续的2D激光雷达地图和按需的静态照片。数据集记录了参与者使用这些多模态通信方式探索远程地点的策略,包括如何利用不同的模态来完成任务,如识别和计数关键实体。SCOUT数据集对于研究人机协作中的多模态通信策略具有重要意义,有助于机器人训练和设计。
实际应用
SCOUT数据集的实际应用场景包括机器人辅助的远程探索、搜索与救援等。通过分析数据集中参与者使用多模态通信的方式,可以改进机器人训练和设计,使其能够更好地理解和执行人类的指令。此外,数据集中的照片请求策略可以为机器人设计提供参考,使其在探索过程中更有效地收集信息。SCOUT数据集的研究成果对于提高人机协作的效率和成功率具有重要意义。
衍生相关工作
SCOUT数据集的发布为人机协作研究提供了新的资源,衍生了许多相关的研究工作。例如,有研究利用SCOUT数据集分析了不同照片请求策略对任务成功的影响,并提出了相应的机器人设计建议。此外,还有研究利用数据集中的多模态通信数据,研究了人机协作中的对话结构和语言使用特点。SCOUT数据集的发布推动了人机协作领域的研究进展,为未来的研究提供了新的方向和思路。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国农村教育发展报告

该数据集包含了中国农村教育发展的相关数据,涵盖了教育资源分布、教育质量、学生表现等多个方面的信息。

www.moe.gov.cn 收录

中国陆域及周边逐日1km全天候地表温度数据集(TRIMS LST;2000-2023)

地表温度(Land surface temperature, LST)是地球表面与大气之间界面的重要参量之一。它既是地表与大气能量交互作用的直接体现,又对于地气过程具有复杂的反馈作用。因此,地表温度不仅是气候变化的敏感指示因子和掌握气候变化规律的重要前提,还是众多模型的直接输入参数,在许多领域有广泛的应用,如气象气候、环境生态、水文等。伴随地学及相关领域研究的深入和精细化,学术界对卫星遥感的全天候地表温度(All-weather LST)具有迫切的需求。 本数据集的制备方法是增强型的卫星热红外遥感-再分析数据集成方法。方法的主要输入数据为Terra/Aqua MODIS LST产品和GLDAS等数据,辅助数据包括卫星遥感提供的植被指数、地表反照率等。方法充分利用了卫星热红外遥感和再分析数据提供的地表温度高频分量、低频分量以及地表温度的空间相关性,最终重建得到较高质量的全天候地表温度数据集。 评价结果表明,本数据集具有良好的图像质量和精度,不仅在空间上无缝,还与当前学术界广泛采用的逐日1 km Terra/Aqua MODIS LST产品在幅值和空间分布上具有较高的一致性。当以MODIS LST为参考时,该数据集在白天和夜间的平均偏差(MBE)为0.09K和-0.03K,偏差标准差(STD)为1.45K和1.17K。基于19个站点实测数据的检验结果表明,其MBE为-2.26K至1.73K,RMSE为0.80K至3.68K,且在晴空与非晴空条件下无显著区别。 本数据集的时间分辨率为逐日4次,空间分辨率为1km,时间跨度为2000年-2023年;空间范围包括我国陆域的主要区域(包含港澳台地区,暂不包含我国南海诸岛)及周边区域(72°E-135°E,19°N-55°N)。本数据集的缩写名为TRIMS LST(Thermal and Reanalysis Integrating Moderate-resolution Spatial-seamless LST),以便用户使用。需要说明的是,TRIMS LST的空间子集TRIMS LST-TP(中国西部逐日1 km全天候地表温度数据集(TRIMS LST-TP;2000-2023)V2)同步在国家青藏高原科学数据中心发布,以减少相关用户数据下载和处理的工作量。

国家青藏高原科学数据中心 收录

人民日报语料库

该数据集包含2023年5月至2024年4月期间人民日报的全部文章,以JSON格式保存,每篇文章包含URL、标题和内容。

github 收录

MedDialog

MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。

github 收录

CHFS中国家庭金融调查数据

  中国家庭金融调查(China Household Finance Survey, CHFS)是中国家庭金融调查与研究中心(以下简称“中心”)在全国范围内开展的抽样调查项目,旨在收集有关家庭金融微观层次的相关信息,主要内容包括:人口特征与就业、资产与负债、收入与消费、社会保障与保险以及主观态度等相关信息,对家庭经济、金融行为进行了全面细致刻画。  CHFS基线调查始于2011年,目前已分别在2011、2013、2015、2017和2019年成功实施五轮全国范围内的抽样调查项目,2021年第六轮调查还在进行中。CHFS最新公开的2019年第五轮调查数据,样本覆盖全国29个省(自治区、直辖市),343个区县,1360个村(居)委会,样本规模达34643户,数据具有全国及省级代表性。

CnOpenData 收录