FusionAudio-1
收藏魔搭社区2025-12-05 更新2025-06-28 收录
下载链接:
https://modelscope.cn/datasets/FreedomIntelligence/FusionAudio-1
下载链接
链接失效反馈官方服务:
资源简介:
# Audio Caption Dataset
## Dataset Description
This dataset contains audio captions from the dataset, including:
- Audio captions
- Speech captions
- Music captions (where available)
- Audio files and metadata
## Dataset Structure
The dataset contains the following columns:
- `id`: Unique identifier for each audio sample
- `audio_caption`: Description of the audio content
- `speech_caption`: Description of speech content
- `music_caption`: Description of music content (may be empty)
- `path`: Relative path to the audio file
- `url`: Original URL (if available)
- `timeinterval`: Time interval information
- `audio`: Audio data
## Dataset Statistics
- Total samples: ~88,000
- Audio format: WAV files
- Sample rate: Variable
## Usage
```python
from datasets import load_dataset
# Load the dataset
dataset = load_dataset("tzzte/FusionAudio-1")
# Access a sample
sample = dataset["train"][0]
print(sample["audio_caption"])
```
# 音频字幕数据集(Audio Caption Dataset)
## 数据集说明
本数据集包含来自该数据集的音频字幕内容,涵盖以下类别:
- 音频字幕
- 语音字幕
- 音乐字幕(视情况提供)
- 音频文件与元数据(metadata)
## 数据集结构
本数据集包含以下字段:
- `id`: 每条音频样本的唯一标识符
- `audio_caption`: 音频内容描述
- `speech_caption`: 语音内容描述
- `music_caption`: 音乐内容描述(可为空)
- `path`: 音频文件的相对路径
- `url`: 原始URL(若有提供)
- `timeinterval`: 时间间隔信息
- `audio`: 音频数据
## 数据集统计
- 总样本量:约88,000条
- 音频格式:WAV文件(WAV)
- 采样率:可变
## 使用方法
python
from datasets import load_dataset
# 加载数据集
dataset = load_dataset("tzzte/FusionAudio-1")
# 访问单条样本
sample = dataset["train"][0]
print(sample["audio_caption"])
提供机构:
maas
创建时间:
2025-06-22



