rumik-ai/sad-batch-ira
收藏Hugging Face2026-04-03 更新2026-04-12 收录
下载链接:
https://hf-mirror.com/datasets/rumik-ai/sad-batch-ira
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: id
dtype: string
- name: audio
dtype:
audio:
sampling_rate: 24000
- name: emotion_tone
dtype: string
- name: speaker_id
dtype: string
- name: user_prompt
dtype: string
- name: duration
dtype: float64
splits:
- name: train
num_examples: 15049
---
# sad-batch-ira
Sad Hinglish audio dataset generated using Gemini Live S2S with voice cloning.
- **Samples:** 15,049
- **Emotion:** sad (12k pure sad + 3k sad+sigh)
- **Language:** Hinglish (Hindi-English code-mixed)
- **Audio:** 24kHz mono WAV, 7-30s duration
- **Speaker:** SP_SP010 (voice cloned)
数据集信息:
特征字段:
- 名称:id
数据类型:字符串
- 名称:audio
数据类型:
音频参数:
采样率:24000
- 名称:emotion_tone
数据类型:字符串
- 名称:speaker_id
数据类型:字符串
- 名称:user_prompt
数据类型:字符串
- 名称:duration
数据类型:双精度浮点数(float64)
数据集划分:
- 划分名称:train(训练集)
样本数量:15049
---
# sad-batch-ira
本数据集为采用Gemini Live S2S结合语音克隆技术生成的印式英语(Hinglish,印地语-英语代码混合语)悲伤语音数据集。
- **样本总量:** 15049
- **情感类型:** 悲伤(其中12000条为纯悲伤语音,3000条为伴随叹息的悲伤语音)
- **语言:** 印式英语(Hinglish,印地语与英语代码混合语)
- **音频规格:** 24kHz单声道WAV格式,时长范围7至30秒
- **说话人:** SP_SP010(经语音克隆生成)
提供机构:
rumik-ai



