aria-synth-conversations_v2
收藏Hugging Face2026-03-25 更新2026-03-26 收录
下载链接:
https://huggingface.co/datasets/tu5687/aria-synth-conversations_v2
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个多模态对话数据集,包含音频和文本特征。数据集结构包括对话ID、说话者ID、轮次ID、文本序列、采样率为24000Hz的音频数据、音频切割索引、带角色标注的对话内容以及情感标签。数据集包含一个训练集,共448个样本,总大小约为713MB。适用于对话系统、情感分析、语音处理等研究任务。
创建时间:
2026-03-24
原始信息汇总
数据集概述
数据集标识
- 数据集名称: aria-synth-conversations_v2
- 托管平台: Hugging Face Datasets
- 存储库地址: https://huggingface.co/datasets/tu5687/aria-synth-conversations_v2
数据配置
- 默认配置名称: default
- 数据格式: Parquet 文件
- 数据文件路径模式:
data/*.parquet
数据划分
- 可用划分: train
- 训练集文件路径:
data/*.parquet



