FusionAudio-2
收藏魔搭社区2025-12-04 更新2025-06-28 收录
下载链接:
https://modelscope.cn/datasets/FreedomIntelligence/FusionAudio-2
下载链接
链接失效反馈官方服务:
资源简介:
# Audio Caption Dataset
## Dataset Description
This dataset contains audio captions from the dataset, including:
- Audio captions
- Speech captions
- Music captions (where available)
- Audio files and metadata
## Dataset Structure
The dataset contains the following columns:
- `id`: Unique identifier for each audio sample
- `audio_caption`: Description of the audio content
- `speech_caption`: Description of speech content
- `music_caption`: Description of music content (may be empty)
- `path`: Relative path to the audio file
- `url`: Original URL (if available)
- `timeinterval`: Time interval information
- `audio`: Audio data
## Dataset Statistics
- Total samples: ~86,000
- Audio format: WAV files
- Sample rate: Variable
## Usage
```python
from datasets import load_dataset
# Load the dataset
dataset = load_dataset("tzzte/FusionAudio-2")
# Access a sample
sample = dataset["train"][0]
print(sample["audio_caption"])
```
# 音频字幕数据集(Audio Caption Dataset)
## 数据集概述
本数据集收录源自源数据集的各类音频字幕内容,具体包括:
- 通用音频字幕
- 语音字幕
- 音乐字幕(若存在对应内容)
- 音频文件与元数据
## 数据集结构
该数据集包含以下字段:
- `id`:每条音频样本的唯一标识符
- `audio_caption`:音频整体内容的描述文本
- `speech_caption`:语音内容的描述文本
- `music_caption`:音乐内容的描述文本(可为空)
- `path`:音频文件的相对存储路径
- `url`:原始来源链接(若可用)
- `timeinterval`:时间区间信息
- `audio`:原始音频数据
## 数据集统计
- 总样本量:约86,000条
- 音频格式:WAV格式文件
- 采样率:可变
## 使用示例
python
from datasets import load_dataset
# 加载数据集
dataset = load_dataset("tzzte/FusionAudio-2")
# 获取单条训练样本
sample = dataset["train"][0]
print(sample["audio_caption"])
提供机构:
maas
创建时间:
2025-06-22



