Vāksañcayaḥ (Sanskrit Speech Corpus by IIT Bombay)
收藏OpenDataLab2026-05-31 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/V_ksa_caya
下载链接
链接失效反馈官方服务:
资源简介:
这个梵语语音语料库有超过 78 小时的音频数据,包含 45,953 个句子的录音,采样率为 22KHz。内容主要是阅读跨越Saṃskṛtam文学的各种sāstras的文本,还包括当代故事、广播节目、即兴话语等。
This Sanskrit speech corpus contains over 78 hours of audio data, consisting of recordings of 45,953 sentences with a sampling rate of 22 kHz. The corpus primarily features readings of texts from various sāstras spanning Sanskrit literature, as well as contemporary stories, radio programs, impromptu utterances, and other related content.
提供机构:
OpenDataLab
创建时间:
2022-09-01
搜集汇总
数据集介绍

背景与挑战
背景概述
Vāksañcayaḥ是一个由IIT Bombay创建的梵语语音语料库,包含超过78小时的音频数据,涵盖45,953个句子录音,采样率为22KHz。其内容涉及传统文学、当代故事、广播节目和即兴话语,由剑桥大学和印度理工学院于2021年发布。
以上内容由遇见数据集搜集并总结生成



