five

FusionAudio-1

收藏
魔搭社区2025-12-05 更新2025-06-28 收录
下载链接:
https://modelscope.cn/datasets/FreedomIntelligence/FusionAudio-1
下载链接
链接失效反馈
官方服务:
资源简介:
# Audio Caption Dataset ## Dataset Description This dataset contains audio captions from the dataset, including: - Audio captions - Speech captions - Music captions (where available) - Audio files and metadata ## Dataset Structure The dataset contains the following columns: - `id`: Unique identifier for each audio sample - `audio_caption`: Description of the audio content - `speech_caption`: Description of speech content - `music_caption`: Description of music content (may be empty) - `path`: Relative path to the audio file - `url`: Original URL (if available) - `timeinterval`: Time interval information - `audio`: Audio data ## Dataset Statistics - Total samples: ~88,000 - Audio format: WAV files - Sample rate: Variable ## Usage ```python from datasets import load_dataset # Load the dataset dataset = load_dataset("tzzte/FusionAudio-1") # Access a sample sample = dataset["train"][0] print(sample["audio_caption"]) ```

# 音频字幕数据集(Audio Caption Dataset) ## 数据集说明 本数据集包含来自该数据集的音频字幕内容,涵盖以下类别: - 音频字幕 - 语音字幕 - 音乐字幕(视情况提供) - 音频文件与元数据(metadata) ## 数据集结构 本数据集包含以下字段: - `id`: 每条音频样本的唯一标识符 - `audio_caption`: 音频内容描述 - `speech_caption`: 语音内容描述 - `music_caption`: 音乐内容描述(可为空) - `path`: 音频文件的相对路径 - `url`: 原始URL(若有提供) - `timeinterval`: 时间间隔信息 - `audio`: 音频数据 ## 数据集统计 - 总样本量:约88,000条 - 音频格式:WAV文件(WAV) - 采样率:可变 ## 使用方法 python from datasets import load_dataset # 加载数据集 dataset = load_dataset("tzzte/FusionAudio-1") # 访问单条样本 sample = dataset["train"][0] print(sample["audio_caption"])
提供机构:
maas
创建时间:
2025-06-22
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作