five

DFKI/radr_intents

收藏
Hugging Face2024-02-05 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/DFKI/radr_intents
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含在紧急响应领域的训练会话中记录的对话,这些对话通常由控制机器人的操作员、团队领导者和任务指挥官之间进行。数据在TRADR和ADRZ项目中被转录和注释,对话被分成多个回合,每个回合都标注了说话者和意图。数据集的语言为德语,包含3525个对话回合,分为训练、开发和测试集。数据集的注释包括紧急响应领域的对话意图,如呼叫、呼叫响应、信息请求、信息提供、确认、否认、命令等。数据集不包含任何个人或敏感信息,且仅涵盖部分紧急情况,如火灾、建筑物倒塌和化学泄漏。

该数据集包含在紧急响应领域的训练会话中记录的对话,这些对话通常由控制机器人的操作员、团队领导者和任务指挥官之间进行。数据在TRADR和ADRZ项目中被转录和注释,对话被分成多个回合,每个回合都标注了说话者和意图。数据集的语言为德语,包含3525个对话回合,分为训练、开发和测试集。数据集的注释包括紧急响应领域的对话意图,如呼叫、呼叫响应、信息请求、信息提供、确认、否认、命令等。数据集不包含任何个人或敏感信息,且仅涵盖部分紧急情况,如火灾、建筑物倒塌和化学泄漏。
提供机构:
DFKI
原始信息汇总

数据集卡片:"Intent Classification for Robot Assisted Disaster Response"

数据集概述

该数据集包含在紧急响应领域训练期间记录的对话。对话通常发生在控制机器人的多个操作员、团队领导和任务指挥官之间。数据由TRADRADRZ项目转录和注释。对话被分成回合,每个回合都由说话者和意图进行注释。

数据集详情

数据集描述

数据集结构

数据实例

json { id: 1235, speaker: UAV, text: wir haben einmal den Akku gewechselt, bis jetzt noch kein Rauch festzustellen ..., label: 2 }

数据字段

  • id: 对话回合的ID,一个int特征
  • speaker: 回合的说话者,一个string特征
  • text: 回合的话语,一个string特征
  • label: 回合的标签,一个int特征

数据分割

该数据集总共包含3525个对话回合。数据分割如下:2610个回合用于训练,310个用于开发,605个用于测试。数据代表连续对话,即前一个ID指的是对话中的前一个回合。

标签描述和统计

标签 含义 训练 百分比 示例
0 disconfirm 35 1.3% Ist negativ, noch nicht.
1 order 216 8.3% Für Sie Erkundungsauftrag: Gesamtüberblick über die Einsatzstelle. Kommen.
2 info_provide 979 37.5% Ich verlasse das Erdgeschoss und gehe ins erste Obergeschoss.
3 info_request 238 9.1% Frage: Erkundungsergebnis aus der östlichen Seite des Gebäudes, kommen.
4 call 487 18.7% RobLW an Zugführer, kommen.
5 call_response 370 14.2% Ja, hier ist Zugführer, kommen.
6 other 43 1.7% Einen Augenblick, ich melde mich gleich.
7 confirm 242 9.3% Ein Lagebild von oben, komplette Lage, und ein Lagebild zwischen den beiden Türen, verstanden.

数据集创建

策划理由

该数据集基于紧急响应领域中使用无线电通信协议的录音。对话的目的是在机器人辅助的灾难响应中协调救援行动。

源数据

数据基于人-人通信在机器人辅助灾难响应中的应用。对话是任务导向的,专注于使用机器人探索某些区域、寻找危险物质、定位火灾、损坏或受害者的团队协作执行任务。

数据收集和处理

初始音频记录在TRADRADRZ项目中收集,由Talking Robots Group, DFKI转录和注释。

注释

注释包括与紧急响应领域通信相关的对话意图:call, call_response, info_request, info_provide, confirm, disconfirm, orderother

注释过程

录音被手动转录并注释了紧急响应意图。总共有3525个对话回合,平均每个回合有6.3个令牌。

注释者

所有注释均由Talking Robots Group, DFKI的研究助理完成。

个人和敏感信息

数据集不包含任何真实姓名、地址或其他个人信息。录音是在紧急情况模拟的训练会话中完成的。

偏差、风险和限制

数据集仅涵盖了可能的紧急情况的一小部分,主要集中在火灾、建筑物倒塌和化学泄漏上。它不涉及许多其他情况,例如交通事故、洪水或爆炸。

引用

该数据集的部分内容已在以下论文中介绍。然而,当前版本由于额外的数据收集包含了更多的注释回合。

BibTeX: bibtex @inproceedings{anikina-2023-towards, title = "Towards Efficient Dialogue Processing in the Emergency Response Domain", author = "Anikina, Tatiana", editor = "Padmakumar, Vishakh and Vallejo, Gisela and Fu, Yao", booktitle = "Proceedings of the 61st Annual Meeting of the Association for Computational Linguistics (Volume 4: Student Research Workshop)", month = jul, year = "2023", address = "Toronto, Canada", publisher = "Association for Computational Linguistics", url = "https://aclanthology.org/2023.acl-srw.31", doi = "10.18653/v1/2023.acl-srw.31", pages = "212--225", abstract = "In this paper we describe the task of adapting NLP models to dialogue processing in the emergency response domain. Our goal is to provide a recipe for building a system that performs dialogue act classification and domain-specific slot tagging while being efficient, flexible and robust. We show that adapter models Pfeiffer et al. (2020) perform well in the emergency response domain and benefit from additional dialogue context and speaker information. Comparing adapters to standard fine-tuned Transformer models we show that they achieve competitive results and can easily accommodate new tasks without significant memory increase since the base model can be shared between the adapters specializing on different tasks. We also address the problem of scarce annotations in the emergency response domain and evaluate different data augmentation techniques in a low-resource setting.", }

APA:

Anikina, T. (2023). Towards Efficient Dialogue Processing in the Emergency Response Domain. Annual Meeting of the Association for Computational Linguistics.

术语表

用于说话者的缩写:

  • UGV: Unmanned Ground Vehicle
  • UAV: Unmanned Aerial Vehicle
  • MC: Mission Commander
  • TL: Team Leader
  • RobLW: Robotikleitwagen (robotic lead vehicle)
  • ZF: Zugführer (fire brigade commander)
  • GF: Gruppenführer (group leader)
  • ELW: Einsatzleitwagen (emergency command vehicle)
  • GW-DUK: Gerätewagen-Daten-und-Kommunikation (vehicle for transporting robots and equipment)
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作