MRDA(ICSI Meeting Recorder Dialog Act Corpus)
收藏OpenDataLab2026-05-24 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/MRDA
下载链接
链接失效反馈官方服务:
资源简介:
MRDA 语料库包含来自 53 位演讲者的 75 次自然会议的约 75 小时演讲。用于标记的标记集是 SWBD-DAMSL 标记集的修改版本。它标注了三类信息:对话行为片段边界的标记、对话行为的标记和对话行为之间的对应关系的标记。 NLP 进度的描述
The MRDA corpus contains approximately 75 hours of speech from 75 natural meetings involving 53 speakers. The tag set employed for annotation is a modified version of the SWBD-DAMSL tag set. It annotates three types of information: tags for the boundaries of dialogue act segments, tags for dialogue acts, and tags for the correspondence relationships between dialogue acts. Description of NLP progress.
提供机构:
OpenDataLab
创建时间:
2022-08-11
搜集汇总
数据集介绍

背景与挑战
背景概述
MRDA(ICSI会议记录对话行为语料库)是一个公开数据集,包含约75小时的自然会议录音,涉及53位演讲者和75次会议。它使用修改的SWBD-DAMSL标记集进行标注,涵盖对话行为片段边界、行为和对应关系,适用于对话行为分类等自然语言处理任务。
以上内容由遇见数据集搜集并总结生成



