five

SPRING-INX

收藏
arXiv2023-10-24 更新2024-06-21 收录
下载链接:
https://github.com/Speech-Lab-IITM/SPRING-INX
下载链接
链接失效反馈
官方服务:
资源简介:
SPRING-INX是由印度理工学院马德拉斯分校的SPRING实验室创建的多语言印度语言语音语料库,旨在支持印度语言的自动语音识别(ASR)系统开发。该数据集包含约2000小时的音频数据,涵盖10种印度语言,所有数据均经过合法来源验证并手动转录。数据集的创建过程包括严格的数据收集和清洗指南,确保数据质量。SPRING-INX的应用领域广泛,主要用于解决印度多语言环境下的通信障碍,支持机器翻译和语音识别技术的开发。

SPRING-INX is a multilingual Indian language speech corpus developed by the SPRING Lab at the Indian Institute of Technology Madras, designed to support the development of automatic speech recognition (ASR) systems for Indian languages. This dataset contains approximately 2000 hours of audio data covering 10 Indian languages, with all data sourced from legitimate channels and manually transcribed. The creation of this dataset follows strict data collection and cleaning guidelines to ensure high data quality. SPRING-INX has broad application scenarios, primarily used to address communication barriers in India's multilingual environment and support the development of machine translation and speech recognition technologies.
提供机构:
印度理工学院马德拉斯分校的SPRING实验室
创建时间:
2023-10-23
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作