Masioki/DSCT2-processed
收藏Hugging Face2024-06-06 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Masioki/DSCT2-processed
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个特征,如对话的轮次、意图、槽位、音频特征、文本内容、说话者和对话信息。数据集分为traindev和test两个部分,分别包含15611和9890个样本,总大小约为1.12GB。
该数据集包含多个特征,如对话的轮次、意图、槽位、音频特征、文本内容、说话者和对话信息。数据集分为traindev和test两个部分,分别包含15611和9890个样本,总大小约为1.12GB。
提供机构:
Masioki
原始信息汇总
数据集概述
数据集特征
- turn: 整数类型 (int64)
- intent: 字符串序列
- slots: 字符串序列
- cam: 字符串类型
- log_pitch_pov: 浮点数序列 (float32)
- log_pitch_der: 浮点数序列 (float32)
- log_total_e: 浮点数序列 (float32)
- log_total_e_lower_bands: 浮点数序列 (float32)
- log_total_e_upper_bands: 浮点数序列 (float32)
- audio: 音频类型,采样率为16000
- text: 字符串类型
- speaker: 字符串类型
- conversation: 字符串类型
数据集分割
- traindev:
- 样本数量: 15611
- 数据大小: 690869250.625 字节
- test:
- 样本数量: 9890
- 数据大小: 430258746.75 字节
数据集大小
- 下载大小: 1054800008 字节
- 数据集总大小: 1121127997.375 字节
配置文件
- default:
- traindev: 数据文件路径为
data/traindev-* - test: 数据文件路径为
data/test-*
- traindev: 数据文件路径为



