FusionAudio-10

Name: FusionAudio-10
Creator: maas
Published: 2025-12-04 09:20:20
License: 暂无描述

魔搭社区2025-12-04 更新2025-06-28 收录

下载链接：

https://modelscope.cn/datasets/FreedomIntelligence/FusionAudio-10

下载链接

链接失效反馈

官方服务：

资源简介：

# Audio Caption Dataset ## Dataset Description This dataset contains audio captions from the dataset, including: - Audio captions - Speech captions - Music captions (where available) - Audio files and metadata ## Dataset Structure The dataset contains the following columns: - `id`: Unique identifier for each audio sample - `audio_caption`: Description of the audio content - `speech_caption`: Description of speech content - `music_caption`: Description of music content (may be empty) - `path`: Relative path to the audio file - `url`: Original URL (if available) - `timeinterval`: Time interval information - `audio`: Audio data ## Usage ```python from datasets import load_dataset # Load the dataset dataset = load_dataset("tzzte/FusionAudio-10") # Access a sample sample = dataset["train"][0] print(sample["audio_caption"]) ```

# 音频字幕数据集（Audio Caption Dataset） ## 数据集说明本数据集收录各类音频字幕相关数据，具体包含： - 全音频字幕 - 语音字幕 - 音乐字幕（若存在对应数据则提供） - 音频文件及元数据 ## 数据集结构本数据集包含以下字段： - `id`：每个音频样本的唯一标识符 - `audio_caption`：音频整体内容的描述文本 - `speech_caption`：语音片段内容的描述文本 - `music_caption`：音乐片段内容的描述文本（可为空） - `path`：音频文件的相对存储路径 - `url`：原始来源URL（若可用） - `timeinterval`：时间区间信息 - `audio`：原始音频数据 ## 使用方法 python from datasets import load_dataset # 加载目标数据集 dataset = load_dataset("tzzte/FusionAudio-10") # 访问单个训练样本 sample = dataset["train"][0] print(sample["audio_caption"])

提供机构：

maas

创建时间：

2025-06-22

5,000+

优质数据集

54 个

任务类型

进入经典数据集