FusionAudio-1

Name: FusionAudio-1
Creator: maas
Published: 2025-12-05 18:48:33
License: 暂无描述

魔搭社区2025-12-05 更新2025-06-28 收录

下载链接：

https://modelscope.cn/datasets/FreedomIntelligence/FusionAudio-1

下载链接

链接失效反馈

官方服务：

资源简介：

# Audio Caption Dataset ## Dataset Description This dataset contains audio captions from the dataset, including: - Audio captions - Speech captions - Music captions (where available) - Audio files and metadata ## Dataset Structure The dataset contains the following columns: - `id`: Unique identifier for each audio sample - `audio_caption`: Description of the audio content - `speech_caption`: Description of speech content - `music_caption`: Description of music content (may be empty) - `path`: Relative path to the audio file - `url`: Original URL (if available) - `timeinterval`: Time interval information - `audio`: Audio data ## Dataset Statistics - Total samples: ~88,000 - Audio format: WAV files - Sample rate: Variable ## Usage ```python from datasets import load_dataset # Load the dataset dataset = load_dataset("tzzte/FusionAudio-1") # Access a sample sample = dataset["train"][0] print(sample["audio_caption"]) ```

# 音频字幕数据集（Audio Caption Dataset） ## 数据集说明本数据集包含来自该数据集的音频字幕内容，涵盖以下类别： - 音频字幕 - 语音字幕 - 音乐字幕（视情况提供） - 音频文件与元数据（metadata） ## 数据集结构本数据集包含以下字段： - `id`: 每条音频样本的唯一标识符 - `audio_caption`: 音频内容描述 - `speech_caption`: 语音内容描述 - `music_caption`: 音乐内容描述（可为空） - `path`: 音频文件的相对路径 - `url`: 原始URL（若有提供） - `timeinterval`: 时间间隔信息 - `audio`: 音频数据 ## 数据集统计 - 总样本量：约88,000条 - 音频格式：WAV文件（WAV） - 采样率：可变 ## 使用方法 python from datasets import load_dataset # 加载数据集 dataset = load_dataset("tzzte/FusionAudio-1") # 访问单条样本 sample = dataset["train"][0] print(sample["audio_caption"])

提供机构：

maas

创建时间：

2025-06-22

5,000+

优质数据集

54 个

任务类型

进入经典数据集