paralinguistic-annotated-v2
收藏Hugging Face2026-03-26 更新2026-03-27 收录
下载链接:
https://huggingface.co/datasets/nadsoft/paralinguistic-annotated-v2
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含200个训练样本,总大小约63.7MB。数据包含多模态特征:每个样本包含唯一标识符(sample_id)、语言标签(language)、原始文本(original_text)、标注文本(annotated_text)、音频时长(duration)、事件数量(n_events)、事件JSON描述(events_json)以及音频数据(audio)。数据集适用于多语言语音文本对齐、事件标注分析等任务,音频文件与文本标注的对应关系可通过事件JSON字段进行细粒度分析。
提供机构:
NADSOFT
创建时间:
2026-03-26



