DFKI/radr_intents
收藏数据集卡片:"Intent Classification for Robot Assisted Disaster Response"
数据集概述
该数据集包含在紧急响应领域训练期间记录的对话。对话通常发生在控制机器人的多个操作员、团队领导和任务指挥官之间。数据由TRADR和ADRZ项目转录和注释。对话被分成回合,每个回合都由说话者和意图进行注释。
数据集详情
数据集描述
- 由以下机构策划: DFKI,Talking Robots Group at MLT
- 语言(NLP): 德语
- 许可证: [更多信息需要]
数据集结构
数据实例
json { id: 1235, speaker: UAV, text: wir haben einmal den Akku gewechselt, bis jetzt noch kein Rauch festzustellen ..., label: 2 }
数据字段
id: 对话回合的ID,一个int特征speaker: 回合的说话者,一个string特征text: 回合的话语,一个string特征label: 回合的标签,一个int特征
数据分割
该数据集总共包含3525个对话回合。数据分割如下:2610个回合用于训练,310个用于开发,605个用于测试。数据代表连续对话,即前一个ID指的是对话中的前一个回合。
标签描述和统计
| 标签 | 含义 | 训练 | 百分比 | 示例 |
|---|---|---|---|---|
| 0 | disconfirm | 35 | 1.3% | Ist negativ, noch nicht. |
| 1 | order | 216 | 8.3% | Für Sie Erkundungsauftrag: Gesamtüberblick über die Einsatzstelle. Kommen. |
| 2 | info_provide | 979 | 37.5% | Ich verlasse das Erdgeschoss und gehe ins erste Obergeschoss. |
| 3 | info_request | 238 | 9.1% | Frage: Erkundungsergebnis aus der östlichen Seite des Gebäudes, kommen. |
| 4 | call | 487 | 18.7% | RobLW an Zugführer, kommen. |
| 5 | call_response | 370 | 14.2% | Ja, hier ist Zugführer, kommen. |
| 6 | other | 43 | 1.7% | Einen Augenblick, ich melde mich gleich. |
| 7 | confirm | 242 | 9.3% | Ein Lagebild von oben, komplette Lage, und ein Lagebild zwischen den beiden Türen, verstanden. |
数据集创建
策划理由
该数据集基于紧急响应领域中使用无线电通信协议的录音。对话的目的是在机器人辅助的灾难响应中协调救援行动。
源数据
数据基于人-人通信在机器人辅助灾难响应中的应用。对话是任务导向的,专注于使用机器人探索某些区域、寻找危险物质、定位火灾、损坏或受害者的团队协作执行任务。
数据收集和处理
初始音频记录在TRADR和ADRZ项目中收集,由Talking Robots Group, DFKI转录和注释。
注释
注释包括与紧急响应领域通信相关的对话意图:call, call_response, info_request, info_provide, confirm, disconfirm, order 和 other。
注释过程
录音被手动转录并注释了紧急响应意图。总共有3525个对话回合,平均每个回合有6.3个令牌。
注释者
所有注释均由Talking Robots Group, DFKI的研究助理完成。
个人和敏感信息
数据集不包含任何真实姓名、地址或其他个人信息。录音是在紧急情况模拟的训练会话中完成的。
偏差、风险和限制
数据集仅涵盖了可能的紧急情况的一小部分,主要集中在火灾、建筑物倒塌和化学泄漏上。它不涉及许多其他情况,例如交通事故、洪水或爆炸。
引用
该数据集的部分内容已在以下论文中介绍。然而,当前版本由于额外的数据收集包含了更多的注释回合。
BibTeX: bibtex @inproceedings{anikina-2023-towards, title = "Towards Efficient Dialogue Processing in the Emergency Response Domain", author = "Anikina, Tatiana", editor = "Padmakumar, Vishakh and Vallejo, Gisela and Fu, Yao", booktitle = "Proceedings of the 61st Annual Meeting of the Association for Computational Linguistics (Volume 4: Student Research Workshop)", month = jul, year = "2023", address = "Toronto, Canada", publisher = "Association for Computational Linguistics", url = "https://aclanthology.org/2023.acl-srw.31", doi = "10.18653/v1/2023.acl-srw.31", pages = "212--225", abstract = "In this paper we describe the task of adapting NLP models to dialogue processing in the emergency response domain. Our goal is to provide a recipe for building a system that performs dialogue act classification and domain-specific slot tagging while being efficient, flexible and robust. We show that adapter models Pfeiffer et al. (2020) perform well in the emergency response domain and benefit from additional dialogue context and speaker information. Comparing adapters to standard fine-tuned Transformer models we show that they achieve competitive results and can easily accommodate new tasks without significant memory increase since the base model can be shared between the adapters specializing on different tasks. We also address the problem of scarce annotations in the emergency response domain and evaluate different data augmentation techniques in a low-resource setting.", }
APA:
Anikina, T. (2023). Towards Efficient Dialogue Processing in the Emergency Response Domain. Annual Meeting of the Association for Computational Linguistics.
术语表
用于说话者的缩写:
- UGV: Unmanned Ground Vehicle
- UAV: Unmanned Aerial Vehicle
- MC: Mission Commander
- TL: Team Leader
- RobLW: Robotikleitwagen (robotic lead vehicle)
- ZF: Zugführer (fire brigade commander)
- GF: Gruppenführer (group leader)
- ELW: Einsatzleitwagen (emergency command vehicle)
- GW-DUK: Gerätewagen-Daten-und-Kommunikation (vehicle for transporting robots and equipment)



