five

paralinguistic-annotated-v2

收藏
Hugging Face2026-03-26 更新2026-03-27 收录
下载链接:
https://huggingface.co/datasets/nadsoft/paralinguistic-annotated-v2
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含200个训练样本,总大小约63.7MB。数据包含多模态特征:每个样本包含唯一标识符(sample_id)、语言标签(language)、原始文本(original_text)、标注文本(annotated_text)、音频时长(duration)、事件数量(n_events)、事件JSON描述(events_json)以及音频数据(audio)。数据集适用于多语言语音文本对齐、事件标注分析等任务,音频文件与文本标注的对应关系可通过事件JSON字段进行细粒度分析。
提供机构:
NADSOFT
创建时间:
2026-03-26
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作