five

Vāksañcayaḥ (Sanskrit Speech Corpus by IIT Bombay)

收藏
OpenDataLab2026-05-31 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/V_ksa_caya
下载链接
链接失效反馈
官方服务:
资源简介:
这个梵语语音语料库有超过 78 小时的音频数据,包含 45,953 个句子的录音,采样率为 22KHz。内容主要是阅读跨越Saṃskṛtam文学的各种sāstras的文本,还包括当代故事、广播节目、即兴话语等。

This Sanskrit speech corpus contains over 78 hours of audio data, consisting of recordings of 45,953 sentences with a sampling rate of 22 kHz. The corpus primarily features readings of texts from various sāstras spanning Sanskrit literature, as well as contemporary stories, radio programs, impromptu utterances, and other related content.
提供机构:
OpenDataLab
创建时间:
2022-09-01
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
Vāksañcayaḥ是一个由IIT Bombay创建的梵语语音语料库,包含超过78小时的音频数据,涵盖45,953个句子录音,采样率为22KHz。其内容涉及传统文学、当代故事、广播节目和即兴话语,由剑桥大学和印度理工学院于2021年发布。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作