five

filwsyl/ascend

收藏
Hugging Face2022-10-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/filwsyl/ascend
下载链接
链接失效反馈
官方服务:
资源简介:
ASCEND(自发性中英数据集)提供了一个高质量的资源,收集了香港自发性多轮对话中的中英代码转换语料库。ASCEND包含10.62小时的自发性语音,总计约12.3K个话语。语料库分为训练集、验证集和测试集,比例为8:1:1,并在每个集合中保持性别比例的平衡。
提供机构:
filwsyl
原始信息汇总

数据集概述

数据集名称

ASCEND: A Spontaneous Chinese-English Dataset for Code-switching in Multi-turn Conversation

数据集摘要

ASCEND是一个高质量的自发多轮对话中文-英文代码转换语料库,收集于香港。该数据集包含10.62小时的自发语音,总计约12.3K条语音。语料库被分为训练、验证和测试三个部分,比例为8:1:1,同时保持每个部分性别比例平衡。

语言

  • 中文
  • 英文

许可证

  • cc-by-sa-4.0

数据集大小

10K<n<100K

任务类别

  • 自动语音识别

任务ID

  • 代码转换
  • 语音识别

数据集来源

  • 原始数据

多语言性

  • 多语言

注释创建者

  • 专家生成

语言创建者

  • 众包
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作