filwsyl/ascend
收藏Hugging Face2022-10-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/filwsyl/ascend
下载链接
链接失效反馈官方服务:
资源简介:
ASCEND(自发性中英数据集)提供了一个高质量的资源,收集了香港自发性多轮对话中的中英代码转换语料库。ASCEND包含10.62小时的自发性语音,总计约12.3K个话语。语料库分为训练集、验证集和测试集,比例为8:1:1,并在每个集合中保持性别比例的平衡。
提供机构:
filwsyl
原始信息汇总
数据集概述
数据集名称
ASCEND: A Spontaneous Chinese-English Dataset for Code-switching in Multi-turn Conversation
数据集摘要
ASCEND是一个高质量的自发多轮对话中文-英文代码转换语料库,收集于香港。该数据集包含10.62小时的自发语音,总计约12.3K条语音。语料库被分为训练、验证和测试三个部分,比例为8:1:1,同时保持每个部分性别比例平衡。
语言
- 中文
- 英文
许可证
- cc-by-sa-4.0
数据集大小
10K<n<100K
任务类别
- 自动语音识别
任务ID
- 代码转换
- 语音识别
数据集来源
- 原始数据
多语言性
- 多语言
注释创建者
- 专家生成
语言创建者
- 众包



