AISHELL-3|语音识别数据集|语音合成数据集
收藏
- AISHELL-3数据集首次发布,包含超过85小时的录音数据,涵盖1000个说话者的语音样本,主要用于高保真语音合成研究。
- AISHELL-3数据集在多个语音合成挑战赛中被广泛应用,推动了高保真语音合成技术的发展。
- 基于AISHELL-3数据集的研究成果在多个国际会议上发表,进一步提升了其在学术界的影响力。
- 1AISHELL-3: A Multi-speaker Mandarin TTS Corpus and the BaselinesAISHELL Foundation · 2020年
- 2Multi-speaker Text-to-Speech Synthesis Using Deep Learning: A SurveyUniversity of Science and Technology of China · 2021年
- 3High-Fidelity Neural Audio CompressionMeta AI · 2022年
- 4Neural Speech Synthesis with Transformer NetworkTencent AI Lab · 2018年
- 5WaveNet: A Generative Model for Raw AudioDeepMind · 2016年
中国食物成分数据库
食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。
国家人口健康科学数据中心 收录
中国交通事故深度调查(CIDAS)数据集
交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、
北方大数据交易中心 收录
RADIOML 2016.10A
一个合成数据集,使用GNU Radio生成,包含11种调制方式(8种数字和3种模拟),信号噪声比各异。该数据集首次在第六届年度GNU Radio会议上发布。
github 收录
LIDC-IDRI
LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。
OpenDataLab 收录
Beijing Traffic
The Beijing Traffic Dataset collects traffic speeds at 5-minute granularity for 3126 roadway segments in Beijing between 2022/05/12 and 2022/07/25.
Papers with Code 收录