paralinguistic-tags

收藏

Hugging Face2026-03-25 更新2026-03-26 收录

下载链接：

https://huggingface.co/datasets/nadsoft/paralinguistic-tags

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含200个音频样本的训练集（总大小约63.7MB），主要特征包括：1) 音频数据（16kHz采样率）及对应时长；2) 原始文本转录与带标签的文本；3) 事件标注信息及事件数量统计；4) 数据处理时间记录；5) 原始数据来源标识。适用于语音识别、音频事件检测、多语言语音处理等任务，每个样本包含完整的音频-文本-事件多维标注体系。

提供机构：

创建时间：

2026-03-25

原始信息汇总

数据集概述

基本信息

数据集名称: paralinguistic-tags
托管平台: Hugging Face Datasets
发布者: nadsoft
数据集地址: https://huggingface.co/datasets/nadsoft/paralinguistic-tags

数据集内容与结构

数据总量: 63,740,611 字节
样本数量: 200 个
下载大小: 58,929,062 字节
数据格式: 包含一个名为“train”的数据拆分。

数据特征

数据集包含以下字段：

audio: 音频数据，采样率为 16000 Hz。
language: 字符串，表示语言。
transcript: 字符串，表示原始文本转录。
tagged_transcript: 字符串，表示带有标注的文本转录。
events: 字符串，表示事件信息。
n_events: 整型（int32），表示事件数量。
audio_duration: 浮点型（float32），表示音频时长。
processing_time: 浮点型（float32），表示处理时间。
source_dataset: 字符串，表示源数据集名称。

配置信息

默认配置名称: default
数据文件路径: data/train-*

© 2023-2026 上海数据发展科技有限责任公司版权所有

沪ICP备17003045号-15 沪公网安备31010402336585号

二维码

社区交流群

二维码

科研交流群

商业服务