five

FusionAudio-2

收藏
魔搭社区2025-12-04 更新2025-06-28 收录
下载链接:
https://modelscope.cn/datasets/FreedomIntelligence/FusionAudio-2
下载链接
链接失效反馈
官方服务:
资源简介:
# Audio Caption Dataset ## Dataset Description This dataset contains audio captions from the dataset, including: - Audio captions - Speech captions - Music captions (where available) - Audio files and metadata ## Dataset Structure The dataset contains the following columns: - `id`: Unique identifier for each audio sample - `audio_caption`: Description of the audio content - `speech_caption`: Description of speech content - `music_caption`: Description of music content (may be empty) - `path`: Relative path to the audio file - `url`: Original URL (if available) - `timeinterval`: Time interval information - `audio`: Audio data ## Dataset Statistics - Total samples: ~86,000 - Audio format: WAV files - Sample rate: Variable ## Usage ```python from datasets import load_dataset # Load the dataset dataset = load_dataset("tzzte/FusionAudio-2") # Access a sample sample = dataset["train"][0] print(sample["audio_caption"]) ```

# 音频字幕数据集(Audio Caption Dataset) ## 数据集概述 本数据集收录源自源数据集的各类音频字幕内容,具体包括: - 通用音频字幕 - 语音字幕 - 音乐字幕(若存在对应内容) - 音频文件与元数据 ## 数据集结构 该数据集包含以下字段: - `id`:每条音频样本的唯一标识符 - `audio_caption`:音频整体内容的描述文本 - `speech_caption`:语音内容的描述文本 - `music_caption`:音乐内容的描述文本(可为空) - `path`:音频文件的相对存储路径 - `url`:原始来源链接(若可用) - `timeinterval`:时间区间信息 - `audio`:原始音频数据 ## 数据集统计 - 总样本量:约86,000条 - 音频格式:WAV格式文件 - 采样率:可变 ## 使用示例 python from datasets import load_dataset # 加载数据集 dataset = load_dataset("tzzte/FusionAudio-2") # 获取单条训练样本 sample = dataset["train"][0] print(sample["audio_caption"])
提供机构:
maas
创建时间:
2025-06-22
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作