five

tamil-audio-dataset

收藏
魔搭社区2025-12-05 更新2025-12-06 收录
下载链接:
https://modelscope.cn/datasets/Kratos-AI/tamil-audio-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
# Tamil Language Audio Dataset **Text spoken by all participants:** "செயற்கை நுண்ணறிவு (AI) வேகமாக வளர்ந்து வருகிறது, அன்றாட வாழ்க்கையை மாற்றுகிறது. இதன் புதுமைகள் கல்வி, மருத்துவம் மற்றும் வேலையை மேம்படுத்துகின்றன, புதிய வாய்ப்புகளை உருவாக்குகின்றன।" The dataset supports training and evaluation of models in: - Automatic Speech Recognition (ASR) - Emotional tone classification - Voice synthesis and generation - Emotion-aware conversational agents --- ## Intended Uses ### ✅ Direct Use - Training and benchmarking ASR models with Indian-accented Marathi. - Emotion detection and classification from voice - Research in affective computing and empathetic AI ### ❌ Out-of-Scope Use - Real-time or production-grade systems - Commercial use without proper CC BY 4.0 attribution - Clinical or diagnostic use cases --- ## Considerations and Limitations - ❗ The dataset is small (<1,000 samples) and not fully representative of India's linguistic and emotional diversity - 💡 Emotions are subjective — classification results may vary by listener or model - 🔄 Future versions will aim to expand multilingual support and speaker diversity --- ## License **CC BY 4.0** — You can use, modify, and share the dataset with appropriate credit. --- ## Contact - For queries or collaborations related to datasets, contact at : - anoushka@kgen.io - abhishek.vadapalli@kgen.io ---

# 泰米尔语音频数据集 **所有参与者的口述文本:** "人工智能(AI)正飞速发展,重塑日常生活。其技术创新赋能教育、医疗与就业领域,并催生全新发展机遇。" 本数据集可支持以下方向的模型训练与评估: - 自动语音识别(Automatic Speech Recognition,ASR) - 情感语调分类 - 语音合成与生成 - 情感感知对话AI智能体(AI Agent) --- ## 预期用途 ### ✅ 直接使用场景 - 针对印度口音马拉地语的自动语音识别模型训练与基准测试 - 基于语音的情感检测与分类 - 情感计算与共情AI相关研究 ### ❌ 超出范围的使用场景 - 实时或工业级生产系统 - 未遵循CC BY 4.0协议进行署名的商业使用 - 临床或诊断类应用场景 --- ## 注意事项与局限性 - ❗ 本数据集规模较小(样本量不足1000),未能完全覆盖印度的语言与情感多样性 - 💡 情感标注具有主观性——分类结果可能因听众或模型的不同而存在差异 - 🔄 未来版本将致力于拓展多语言支持与说话人多样性 --- ## 授权协议 **CC BY 4.0** — 您可在给予适当署名的前提下,使用、修改并分享本数据集。 --- ## 联系方式 - 有关数据集的咨询或合作事宜,请联系: - anoushka@kgen.io - abhishek.vadapalli@kgen.io
提供机构:
maas
创建时间:
2025-08-29
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作