VCTK|语音识别数据集|语音合成数据集
收藏
- VCTK数据集首次发表,包含来自109位不同口音的英语母语者的语音数据。
- VCTK数据集首次应用于语音合成研究,为研究人员提供了丰富的语音资源。
- VCTK数据集被广泛用于多说话人语音识别系统的训练和评估。
- VCTK数据集的扩展版本发布,增加了更多的语音样本和多样性。
- VCTK数据集在自然语言处理和语音技术领域的重要性得到进一步认可,成为多个国际会议和研讨会的研究主题。
- 1CSTR VCTK Corpus: English Multi-speaker Corpus for CSTR Voice Cloning ToolkitUniversity of Edinburgh · 2019年
- 2WaveNet: A Generative Model for Raw AudioDeepMind · 2016年
- 3Natural TTS Synthesis by Conditioning WaveNet on Mel Spectrogram PredictionsGoogle · 2018年
- 4Neural Voice Cloning with a Few SamplesTencent AI Lab · 2018年
- 5FastSpeech: Fast, Robust and Controllable Text to SpeechMicrosoft Research · 2019年
中国农村教育发展报告
该数据集包含了中国农村教育发展的相关数据,涵盖了教育资源分布、教育质量、学生表现等多个方面的信息。
www.moe.gov.cn 收录
FEVER
FEVER(Fact Extraction and VERification)数据集是一个用于事实验证任务的数据集,包含超过185,000个标注的声明,这些声明需要从维基百科中提取证据进行验证。数据集的目标是帮助开发和评估自动事实验证系统。
fever.ai 收录
LinkedIn Salary Insights Dataset
LinkedIn Salary Insights Dataset 提供了全球范围内的薪资数据,包括不同职位、行业、地理位置和经验水平的薪资信息。该数据集旨在帮助用户了解薪资趋势和市场行情,支持职业规划和薪资谈判。
www.linkedin.com 收录
公交线路时段客流分析
通过多层次、多维度的数据采集与处理方法获取乘客的上下车时间、地点、乘车刷卡类型等数据,再结合杭州公交线路数据和站点数据,可以为各大地图厂商、商业地产、相关政府单位主体等提供关于杭州市不同线路、不同站点在不同时间段的客流量分析服务,例如杭州市不同公交线路/站点的每日客流汇总、周均值客流、刷卡方式分布数据等,运用图表、地图、热力图、公交客流OD矩阵等直观方式展示分析结果,使复杂数据易于理解,还可根据具体需求,提供不同维度、不同时间跨度的定制化分析结果,满足不同主体的信息需求。
杭州数据交易所 收录
HazyDet
HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。
arXiv 收录