five

MRDA(ICSI Meeting Recorder Dialog Act Corpus)

收藏
OpenDataLab2026-05-24 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/MRDA
下载链接
链接失效反馈
官方服务:
资源简介:
MRDA 语料库包含来自 53 位演讲者的 75 次自然会议的约 75 小时演讲。用于标记的标记集是 SWBD-DAMSL 标记集的修改版本。它标注了三类信息:对话行为片段边界的标记、对话行为的标记和对话行为之间的对应关系的标记。 NLP 进度的描述

The MRDA corpus contains approximately 75 hours of speech from 75 natural meetings involving 53 speakers. The tag set employed for annotation is a modified version of the SWBD-DAMSL tag set. It annotates three types of information: tags for the boundaries of dialogue act segments, tags for dialogue acts, and tags for the correspondence relationships between dialogue acts. Description of NLP progress.
提供机构:
OpenDataLab
创建时间:
2022-08-11
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
MRDA(ICSI会议记录对话行为语料库)是一个公开数据集,包含约75小时的自然会议录音,涉及53位演讲者和75次会议。它使用修改的SWBD-DAMSL标记集进行标注,涵盖对话行为片段边界、行为和对应关系,适用于对话行为分类等自然语言处理任务。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作