FusionAudio-10
收藏魔搭社区2025-12-04 更新2025-06-28 收录
下载链接:
https://modelscope.cn/datasets/FreedomIntelligence/FusionAudio-10
下载链接
链接失效反馈官方服务:
资源简介:
# Audio Caption Dataset
## Dataset Description
This dataset contains audio captions from the dataset, including:
- Audio captions
- Speech captions
- Music captions (where available)
- Audio files and metadata
## Dataset Structure
The dataset contains the following columns:
- `id`: Unique identifier for each audio sample
- `audio_caption`: Description of the audio content
- `speech_caption`: Description of speech content
- `music_caption`: Description of music content (may be empty)
- `path`: Relative path to the audio file
- `url`: Original URL (if available)
- `timeinterval`: Time interval information
- `audio`: Audio data
## Usage
```python
from datasets import load_dataset
# Load the dataset
dataset = load_dataset("tzzte/FusionAudio-10")
# Access a sample
sample = dataset["train"][0]
print(sample["audio_caption"])
```
# 音频字幕数据集(Audio Caption Dataset)
## 数据集说明
本数据集收录各类音频字幕相关数据,具体包含:
- 全音频字幕
- 语音字幕
- 音乐字幕(若存在对应数据则提供)
- 音频文件及元数据
## 数据集结构
本数据集包含以下字段:
- `id`:每个音频样本的唯一标识符
- `audio_caption`:音频整体内容的描述文本
- `speech_caption`:语音片段内容的描述文本
- `music_caption`:音乐片段内容的描述文本(可为空)
- `path`:音频文件的相对存储路径
- `url`:原始来源URL(若可用)
- `timeinterval`:时间区间信息
- `audio`:原始音频数据
## 使用方法
python
from datasets import load_dataset
# 加载目标数据集
dataset = load_dataset("tzzte/FusionAudio-10")
# 访问单个训练样本
sample = dataset["train"][0]
print(sample["audio_caption"])
提供机构:
maas
创建时间:
2025-06-22



