anyspeech/frame_labels
收藏Hugging Face2023-12-08 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/anyspeech/frame_labels
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个语音相关的特征,如转换后的语音细节、方言区域、文件路径、帧标签、句子类型、说话者ID、文本内容等。此外,数据集还包含音频数据,包括音频数组和采样率。数据集分为训练集和测试集,分别包含4620和1680个样本,总大小为2516589924字节。
该数据集包含多个语音相关的特征,如转换后的语音细节、方言区域、文件路径、帧标签、句子类型、说话者ID、文本内容等。此外,数据集还包含音频数据,包括音频数组和采样率。数据集分为训练集和测试集,分别包含4620和1680个样本,总大小为2516589924字节。
提供机构:
anyspeech
原始信息汇总
数据集概述
数据特征
- converted_phonetic_detail
- start: 序列类型,float64
- stop: 序列类型,float64
- utterance: 序列类型,string
- dialect_region: 字符串类型
- file: 字符串类型
- frame_labels: 序列类型,string
- id: 字符串类型
- merge_phonetic_detail
- start: 序列类型,float64
- stop: 序列类型,float64
- utterance: 序列类型,string
- phonetic_detail
- start: 整数类型,int64
- stop: 整数类型,int64
- utterance: 字符串类型
- sentence_type: 字符串类型
- speaker_id: 字符串类型
- text: 字符串类型
- word_detail
- start: 序列类型,float64
- stop: 序列类型,float64
- utterance: 序列类型,string
- frame_labels_10ms: 序列类型,string
- audio
- array: 序列类型,float64
- sampling_rate: 整数类型,int64
数据分割
- train
- 字节数: 1843096543
- 样本数: 4620
- test
- 字节数: 673493381
- 样本数: 1680
数据集大小
- 下载大小: 558422047
- 数据集大小: 2516589924
配置
- default
- train: data/train-*
- test: data/test-*



