Voice Separation API
收藏RapidAPI2026-04-11 更新2025-12-03 收录
下载链接:
https://rapidapi.com/songfinder-songfinder-default/api/voice-separation-api
下载链接
链接失效反馈官方服务:
资源简介:
Separate vocals and instruments from any audio file using AI. Extract clean vocal tracks or create karaoke instrumentals with state-of-the-art stem separation.
创建时间:
2026-04-11
原始信息汇总
Voice Separation API 数据集概述
数据集基本信息
- 数据集名称: Voice Separation API
- 提供方: SongFinder
- 类别: Music
- 访问地址: https://rapidapi.com/songfinder-songfinder-default/api/voice-separation-api
数据集描述
该API利用先进的AI驱动音轨分离技术,将音频文件分离为独立的人声和伴奏音轨。基于最先进的AI Transformer模型,可为音乐制作、卡拉OK创建、混音和音频分析提供专业质量的分离服务。
核心功能
- AI驱动分离: 采用最先进的深度学习技术
- 工作室质量: 专业级音频处理
- 双音轨输出: 干净分离的人声和伴奏
- 快速处理: 典型音频平均处理时间<30秒
- 多格式支持: 支持MP3、WAV、FLAC、M4A、AAC、OGG、WebM、MP4、AVI、MKV、MOV等格式
- 大文件支持: 最大支持50MB文件
- 云存储: 通过安全URL(CloudFlare R2 CDN)交付音轨
- 多层级: 为各种用例提供充足的配额
- 使用跟踪: 实时配额监控
订阅层级与配额
| 层级 | 每月分钟数 | 单文件最大时长 | 并发请求数 |
|---|---|---|---|
| Basic | 20分钟 | 5分钟 | 1 |
| Pro | 200分钟 | 10分钟 | 2 |
| Ultra | 650分钟 | 20分钟 | 5 |
| Mega | 2,500分钟 | 无限制 | 10 |
配额详情
- 每月分钟数: 每个日历月的总音频处理时间
- 每月1日00:00 UTC重置
- 跟踪实际音频时长(非处理时间)
- 单文件最大时长: 单个音频文件的最大长度
- 硬性限制 - 超过此限制的请求将立即被拒绝
- 不跨请求累积
- 配额执行策略:
- 单文件限制(硬性):文件不得超过您层级的单文件最大时长
- 每月配额(软性,带宽限):
- 只要您有任何剩余配额(>0分钟),即使文件超过剩余配额,您的请求仍被允许
- 配额达到0后,所有进一步请求将被阻止,直到下个月
端点
1. 分离音频
- 端点:
POST /api/rapidapi/separate-audio - 内容类型:
multipart/form-data - 请求参数:
file(文件,必需):音频或视频文件
- 成功响应:
- 状态码:
200 OK - 响应字段包括:
success、vocalsUrl、instrumentsUrl、message、cached、fileInfo、usage
- 状态码:
- 重要提示: 下载链接有效期为48小时,请立即下载并存储音轨
2. 获取使用统计
- 端点:
GET /api/rapidapi/usage - 内容类型:
application/json - 请求: 无需参数,用户身份通过RapidAPI头部识别
- 成功响应:
- 状态码:
200 OK - 响应字段包括:
success、userId、subscription、month、minutesUsed、monthlyQuota、remaining、requestCount、percentUsed、lastUpdated、resetDate、tierInfo
- 状态码:
错误响应
400 Bad Request- 未提供文件400 Bad Request- 时长超出限制413 Payload Too Large- 文件超过50MB429 Too Many Requests- 并发请求限制500 Internal Server Error- 分离失败
支持的文件格式
音频格式
MP3、WAV、FLAC、M4A、AAC、OGG、WebM
视频格式
MP4、WebM、OGG、QuickTime/MOV、AVI、MKV
注意: 对于视频文件,仅提取并处理音轨。输出始终为WAV格式。
输出格式
音轨文件
人声和伴奏均以WAV文件返回,规格如下:
- 格式: WAV(未压缩)
- 采样率: 44.1 kHz
- 位深度: 16-bit
- 声道: 立体声(2声道)
- 质量: 工作室级分离
速率限制与配额
每月配额
- Basic: 20分钟/月
- Pro: 200分钟/月
- Ultra: 650分钟/月
- Mega: 2,500分钟/月
配额每月1日00:00 UTC为所有订阅者重置。
单文件时长限制
- Basic: 5分钟(300秒)
- Pro: 10分钟(600秒)
- Ultra: 20分钟(1,200秒)
- Mega: 无限制
并发请求
每个用户一次只能处理一个分离请求(可按层级配置)。在处理过程中提交第二个请求将导致429 Too Many Requests错误。
处理时间
- 平均: 10-60秒,取决于音频长度
- 冷启动(首次请求): 可能额外需要最多30秒
常见问题
每月配额如何工作?
每月配额以处理的音频分钟数衡量,而非API调用次数。配额每月1日00:00 UTC重置。
如果我超出配额会怎样?
API采用宽松的软限制方法:只要文件不超过您层级的最大时长,您可以继续处理文件。配额达到0后,处理继续但不再扣除额外配额。每月配额仅为信息性,不会阻止请求。
我可以在月中升级层级吗?
可以!升级时:您的新配额立即生效,先前层级任何未使用的配额将被没收,新配额在下个月1日重置。
为什么我会收到并发请求错误?
每个用户一次只能处理一个分离请求(可按层级配置)。请等待当前请求完成后再提交另一个。处理通常需要10-60秒。
下载链接有效期多长?
音轨链接在生成后有效期为48小时。请立即下载并将文件存储到您自己的存储中。
支持
如需技术支持、功能请求或错误报告:
- 邮箱: support@songfinder.gg
- 网站: https://songfinder.gg/contact
搜集汇总
数据集介绍

背景与挑战
背景概述
该API通过AI技术实现音频文件中人声与乐器的智能分离,可生成纯净人声轨道或制作卡拉OK伴奏,采用先进的音源分离技术。
以上内容由遇见数据集搜集并总结生成



