FusionAudio-2

Name: FusionAudio-2
Creator: maas
Published: 2025-12-04 09:20:20
License: 暂无描述

魔搭社区2025-12-04 更新2025-06-28 收录

下载链接：

https://modelscope.cn/datasets/FreedomIntelligence/FusionAudio-2

下载链接

链接失效反馈

官方服务：

资源简介：

# Audio Caption Dataset ## Dataset Description This dataset contains audio captions from the dataset, including: - Audio captions - Speech captions - Music captions (where available) - Audio files and metadata ## Dataset Structure The dataset contains the following columns: - `id`: Unique identifier for each audio sample - `audio_caption`: Description of the audio content - `speech_caption`: Description of speech content - `music_caption`: Description of music content (may be empty) - `path`: Relative path to the audio file - `url`: Original URL (if available) - `timeinterval`: Time interval information - `audio`: Audio data ## Dataset Statistics - Total samples: ~86,000 - Audio format: WAV files - Sample rate: Variable ## Usage ```python from datasets import load_dataset # Load the dataset dataset = load_dataset("tzzte/FusionAudio-2") # Access a sample sample = dataset["train"][0] print(sample["audio_caption"]) ```

# 音频字幕数据集（Audio Caption Dataset） ## 数据集概述本数据集收录源自源数据集的各类音频字幕内容，具体包括： - 通用音频字幕 - 语音字幕 - 音乐字幕（若存在对应内容） - 音频文件与元数据 ## 数据集结构该数据集包含以下字段： - `id`：每条音频样本的唯一标识符 - `audio_caption`：音频整体内容的描述文本 - `speech_caption`：语音内容的描述文本 - `music_caption`：音乐内容的描述文本（可为空） - `path`：音频文件的相对存储路径 - `url`：原始来源链接（若可用） - `timeinterval`：时间区间信息 - `audio`：原始音频数据 ## 数据集统计 - 总样本量：约86,000条 - 音频格式：WAV格式文件 - 采样率：可变 ## 使用示例 python from datasets import load_dataset # 加载数据集 dataset = load_dataset("tzzte/FusionAudio-2") # 获取单条训练样本 sample = dataset["train"][0] print(sample["audio_caption"])

提供机构：

maas

创建时间：

2025-06-22

5,000+

优质数据集

54 个

任务类型

进入经典数据集