five

CrowdSpeech and Vox DIY: Benchmark Dataset for Crowdsourced Audio Transcription

收藏
NIAID Data Ecosystem2026-03-13 收录
下载链接:
https://zenodo.org/record/5574584
下载链接
链接失效反馈
官方服务:
资源简介:
We collect and release CrowdSpeech — the first publicly available large-scale dataset of crowdsourced audio transcriptions. e show its applicability on an under-resourced language by constructing VoxDIY — a counterpart of CrowdSpeech for the Russian language.

本研究收集并发布了CrowdSpeech——首个公开可用的大规模众包音频转录数据集。本研究通过构建针对俄语的CrowdSpeech对应数据集VoxDIY,验证了该数据集在低资源语言场景下的应用可行性。
创建时间:
2021-10-25
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作