CHiME-5|自动语音识别数据集|语音处理技术数据集
收藏
- CHiME-5数据集首次发布,旨在推动多通道语音识别技术的发展,特别是在真实世界噪声环境中的应用。
- CHiME-5数据集在多个国际语音识别竞赛中被广泛使用,促进了相关算法和模型的研究与优化。
- 基于CHiME-5数据集的研究成果开始应用于实际产品中,特别是在智能家居和可穿戴设备领域。
- 1The 5th CHiME Speech Separation and Recognition Challenge: Dataset, Task and BaselinesUniversity of Sheffield, University of Edinburgh, University of Stuttgart · 2018年
- 2Improving Robustness of ASR Systems in Realistic Environments Using CHiME-5 DatasetUniversity of Edinburgh, University of Sheffield · 2020年
- 3A Study on Speech Enhancement Techniques for CHiME-5 DatasetUniversity of Stuttgart, University of Sheffield · 2019年
- 4End-to-End Speech Recognition on CHiME-5: A Comparative StudyUniversity of Edinburgh, University of Stuttgart · 2021年
- 5Multi-Channel Speech Recognition with CHiME-5 DatasetUniversity of Sheffield, University of Edinburgh · 2020年
中国交通事故深度调查(CIDAS)数据集
交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、
北方大数据交易中心 收录
中国农村金融统计数据
该数据集包含了中国农村金融的统计信息,涵盖了农村金融机构的数量、贷款余额、存款余额、金融服务覆盖率等关键指标。数据按年度和地区分类,提供了详细的农村金融发展状况。
www.pbc.gov.cn 收录
WideIRSTD Dataset
WideIRSTD数据集包含七个公开数据集:SIRST-V2、IRSTD-1K、IRDST、NUDT-SIRST、NUDT-SIRST-Sea、NUDT-MIRSDT、Anti-UAV,以及由国防科技大学团队开发的数据集,包括模拟陆基和太空基数据,以及真实手动标注的太空基数据。数据集包含具有各种目标形状(如点目标、斑点目标、扩展目标)、波长(如近红外、短波红外和热红外)、图像分辨率(如256、512、1024、3200等)的图像,以及不同的成像系统(如陆基、空基和太空基成像系统)。
github 收录
Figshare
Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。
figshare.com 收录
PQAref
PQAref数据集是一个用于生物医学领域参考问答任务的数据集,旨在微调大型语言模型。该数据集包含三个部分:指令(问题)、摘要(从PubMed检索的相关摘要,包含PubMed ID、摘要标题和内容)和答案(预期答案,包含PubMed ID形式的参考)。数据集通过半自动方式创建,利用了PubMedQA数据集中的问题。
huggingface 收录