five

CHiME-6|语音识别数据集|音频处理数据集

收藏
OpenDataLab2025-03-29 更新2024-05-09 收录
语音识别
音频处理
下载链接:
https://opendatalab.org.cn/OpenDataLab/CHiME-6
下载链接
链接失效反馈
资源简介:
继第一届、第二届、第三届、第四届和第五届CHiME取得成功之后 我们组织了第六届CHiME Speech Separation 和挑战 认可挑战(CHiME-6)。 新挑战重温 之前的CHiME-5挑战赛进一步考虑了日常家庭环境中远程多麦克风会话语音分类和识别的问题。 演讲 材料与之前的 CHiME-5 录音相同,除了 用于精确的阵列同步。 材料被引出 使用晚宴场景并努力捕获数据 这是自然会话语音的代表。 本文提供了 CHiME-6 挑战的基线描述 适用于分段多说话人语音识别(轨道 1) 和未分段的多说话者语音识别(轨道 2)。 的 注意,Track 2是社区第一个挑战活动 使用一整套可重现的开源基线来处理未分段的多说话者语音识别场景 提供语音增强、说话人分类和语音 识别模块。
提供机构:
OpenDataLab
创建时间:
2023-06-25
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

AISHELL/AISHELL-1

Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。

hugging_face 收录

Google Scholar

Google Scholar是一个学术搜索引擎,旨在检索学术文献、论文、书籍、摘要和文章等。它涵盖了广泛的学科领域,包括自然科学、社会科学、艺术和人文学科。用户可以通过关键词搜索、作者姓名、出版物名称等方式查找相关学术资源。

scholar.google.com 收录

Materials Project

材料项目是一组标有不同属性的化合物。数据集链接: MP 2018.6.1(69,239 个材料) MP 2019.4.1(133,420 个材料)

OpenDataLab 收录

URPC系列数据集, S-URPC2019, UDD

URPC系列数据集包括URPC2017至URPC2020DL,主要用于水下目标的检测和分类。S-URPC2019专注于水下环境的特定检测任务。UDD数据集信息未在README中详细描述。

github 收录

中国近海台风路径集合数据集(1945-2024)

1945-2024年度,中国近海台风路径数据集,包含每个台风的真实路径信息、台风强度、气压、中心风速、移动速度、移动方向。 数据源为获取温州台风网(http://www.wztf121.com/)的真实观测路径数据,经过处理整合后形成文件,如使用csv文件需使用文本编辑器打开浏览,否则会出现乱码,如要使用excel查看数据,请使用xlsx的格式。

国家海洋科学数据中心 收录