five

urdu-language-audiodataset

收藏
魔搭社区2025-12-05 更新2025-12-06 收录
下载链接:
https://modelscope.cn/datasets/Kratos-AI/urdu-language-audiodataset
下载链接
链接失效反馈
官方服务:
资源简介:
# Urdu Language Audio Dataset **Text spoken by all participants:** مصنوعی ذہانت (AI) تیزی سے ترقی کر رہی ہے، جو روزمرہ کی زندگی کو بدل رہی ہے۔ اس کی اختراعات تعلیم، صحت کی دیکھ بھال اور کام کو بہتر بنا رہی ہیں، نئے مواقع پیدا کر رہی ہیں۔ The dataset supports training and evaluation of models in: - Automatic Speech Recognition (ASR) - Emotional tone classification - Voice synthesis and generation - Emotion-aware conversational agents --- ## Intended Uses ### ✅ Direct Use - Training and benchmarking ASR models with Indian-accented Marathi. - Emotion detection and classification from voice - Research in affective computing and empathetic AI ### ❌ Out-of-Scope Use - Real-time or production-grade systems - Commercial use without proper CC BY 4.0 attribution - Clinical or diagnostic use cases --- ## Considerations and Limitations - ❗ The dataset is small (<1,000 samples) and not fully representative of India's linguistic and emotional diversity - 💡 Emotions are subjective — classification results may vary by listener or model - 🔄 Future versions will aim to expand multilingual support and speaker diversity --- ## License **CC BY 4.0** — You can use, modify, and share the dataset with appropriate credit. --- ## Contact - For queries or collaborations related to datasets, contact at : - anoushka@kgen.io - abhishek.vadapalli@kgen.io ---

# 乌尔都语音频数据集 **所有参与者的口述文本:** 人工智能(AI)正处于快速发展的进程中,正深刻改变着人们的日常生活。其创新成果正优化教育、医疗保健与工作场景,并催生全新的发展机遇。 本数据集可用于支撑以下方向的模型训练与评估: - 自动语音识别(Automatic Speech Recognition,ASR) - 情感语调分类 - 语音合成与生成 - 情感感知型AI智能体(AI Agent) --- ## 预期用途 ### ✅ 合规适用场景 - 针对带有印度口音的马拉地语开展自动语音识别模型的训练与基准测试 - 基于语音信号的情感检测与分类任务 - 情感计算与共情式人工智能领域的相关研究 ### ❌ 超出适用范围的使用场景 - 实时系统或工业级生产部署场景 - 未按要求标注CC BY 4.0协议的商业使用行为 - 临床诊断或医疗相关的应用场景 --- ## 注意事项与局限性 - ❗ 本数据集规模较小(样本量不足1000条),未能完全覆盖印度的语言与情感多样性 - 💡 情感评判具有主观性——分类结果可能因评估者或模型的不同而存在差异 - 🔄 未来版本将致力于拓展多语言支持与说话人多样性 --- ## 许可协议 **CC BY 4.0** — 您可在标注适当来源的前提下,对本数据集进行使用、修改与分享。 --- ## 联系方式 - 若有数据集相关的咨询或合作需求,请联系以下邮箱: - anoushka@kgen.io - abhishek.vadapalli@kgen.io
提供机构:
maas
创建时间:
2025-08-29
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作