five

Audio Book Corpus

收藏
github2016-01-04 更新2024-05-31 收录
下载链接:
https://github.com/chaitanyagadam/Audio-Book-Corpus-for-European-Languages
下载链接
链接失效反馈
官方服务:
资源简介:
Audio Book Corpus项目旨在帮助语言学研究人员在文本到语音领域进行纯学术研究。目前包含约200分钟的德语语音数据,未来将扩展至包括法语、西班牙语、捷克语、荷兰语、波兰语、罗马尼亚语等多种欧洲语言。数据来源于Librivox,采用深度学习和模糊匹配技术进行半自动标注。

The Audio Book Corpus project is designed to assist linguistic researchers in conducting purely academic research in the field of text-to-speech. Currently, it includes approximately 200 minutes of German speech data, with plans to expand to include various European languages such as French, Spanish, Czech, Dutch, Polish, and Romanian in the future. The data is sourced from Librivox and is semi-automatically annotated using deep learning and fuzzy matching techniques.
创建时间:
2016-01-04
原始信息汇总

数据集概述

数据集名称

  • Audio-Book-Corpus (ABC)

数据集目的

  • 用于支持语言学研究者在文本到语音领域的学术研究。

数据集内容

  • 当前版本包含约200分钟的德语语音数据。
  • 语音数据格式为wave文件,来源于Librivox(https://librivox.org/)。

数据集语言

  • 当前版本:德语
  • 未来计划:葡萄牙语、意大利语、法语、西班牙语、捷克语、荷兰语、波兰语、罗马尼亚语等欧洲语言。

数据集模块

  • 由三个模块组成。

数据集标注技术

  • 使用半自动标注,结合深度学习和模糊匹配技术。
  • 20%的数据由人工标注,80%的数据通过训练的机器进行验证。
  • 开发了一个小型GUI(基于Python平台),用于可视化音频文件和标注文本,确保与语音信号的完美一致性和匹配。

数据集贡献者

  • Ajinkya Kulkarni (ajinkyakulkarni14@gmail.com)
  • Parth Gargava (parthstein@gmail.com)

数据集许可

  • 根据GNU GPL许可,用户享有使用、修改、分享软件及其修改版本的自由。
  • 建议在使用数据集进行研究时,对作者Ajinkya Kulkarni和Parth Gargava给予适当的认可。
搜集汇总
数据集介绍
main_image_url
构建方式
Audio Book Corpus(ABC)项目旨在助力语言学研究者开展文本转语音领域的研究。该数据集的构建采用三个模块,以Librivox的公共领域免费有声读物为数据源,通过波形文件格式存储语音数据。在标注技术上,数据集首先进行降噪处理,随后采用深度学习和模糊匹配技术进行半自动标注,其中20%的数据由人工标注,剩余80%的语音数据通过深度学习技术进行验证,并开发了一个小型GUI(基于python平台)以实现音频文件和标注文本的完美对应。
特点
该数据集的特点在于,它包含了大约200分钟德语语音数据,且正在开发葡萄牙语和意大利语版本,未来版本将涵盖大多数欧洲语言。此外,ABC数据集的构建注重深度学习和模糊匹配技术在语音标注中的应用,使得标注过程更加高效、准确。
使用方法
在使用该数据集时,用户应遵循GNU GPL协议,该协议赋予用户使用、修改、分享软件及分享修改内容的自由。用户在使用数据集进行研究时,建议对作者Ajinkya Kulkarni和Parth Gargava给予适当的认可。
背景与挑战
背景概述
Audio Book Corpus(ABC)项目,旨在助力语言学领域的研究者,特别是那些从事文本转语音研究的学者。该项目始建于一个学术目的的背景下,目前已发展至包含大约200分钟的德语语音数据。ABC项目由Ajinkya Kulkarni与Parth Gargava共同推进,不仅致力于德语语音数据集的开发,还包括葡萄牙语和意大利语的数据集构建工作。未来的版本预期将涵盖大部分欧洲语言,如法语、西班牙语、捷克语、荷兰语、波兰语和罗马尼亚语。该数据集为学术界提供了宝贵的资源,对文本转语音技术的研发具有重要的推动作用。
当前挑战
ABC数据集在构建过程中面临了诸多挑战。首先,语音数据的获取与清洗是一个挑战,因为需要确保音频质量满足研究需求。其次,数据集的标注工作也极具挑战,采用了半自动化的标注方法,结合深度学习和模糊匹配技术,人工标注了20%,剩余80%的语音数据通过机器进行验证。此外,构建可视化工具GUI以实现音频文件与标注文本的完美对应,也是技术上的一个挑战。在解决领域问题方面,ABC数据集需应对如何提高文本转语音的自然度与准确性的挑战,这对于语音合成技术的发展至关重要。
常用场景
经典使用场景
在文本转语音研究领域,Audio Book Corpus (ABC) 数据集被广泛应用于提供语言学研究的基础资源。该数据集以其丰富的德语语音资料,为学者们提供了约200分钟的纯净语音数据,成为研究文本到语音转换算法的重要基准。
实际应用
实际应用中,ABC 数据集不仅服务于学术研究,还可在语音合成系统、语言学习工具和智能助手等开发中发挥重要作用。其开放性和多样性语言资源,为各种产品的多语言支持提供了基础。
衍生相关工作
基于ABC数据集的研究,衍生了众多经典工作,如改进的语音识别算法、跨语言的文本转语音模型等。这些工作不仅提升了语音处理技术的精度和效率,也为多语言信息处理和交流带来了新的可能性。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作