five

Voice Separation API

收藏
RapidAPI2026-04-11 更新2025-12-03 收录
下载链接:
https://rapidapi.com/songfinder-songfinder-default/api/voice-separation-api
下载链接
链接失效反馈
官方服务:
资源简介:
Separate vocals and instruments from any audio file using AI. Extract clean vocal tracks or create karaoke instrumentals with state-of-the-art stem separation.
创建时间:
2026-04-11
原始信息汇总

Voice Separation API 数据集概述

数据集基本信息

  • 数据集名称: Voice Separation API
  • 提供方: SongFinder
  • 类别: Music
  • 访问地址: https://rapidapi.com/songfinder-songfinder-default/api/voice-separation-api

数据集描述

该API利用先进的AI驱动音轨分离技术,将音频文件分离为独立的人声和伴奏音轨。基于最先进的AI Transformer模型,可为音乐制作、卡拉OK创建、混音和音频分析提供专业质量的分离服务。

核心功能

  • AI驱动分离: 采用最先进的深度学习技术
  • 工作室质量: 专业级音频处理
  • 双音轨输出: 干净分离的人声和伴奏
  • 快速处理: 典型音频平均处理时间<30秒
  • 多格式支持: 支持MP3、WAV、FLAC、M4A、AAC、OGG、WebM、MP4、AVI、MKV、MOV等格式
  • 大文件支持: 最大支持50MB文件
  • 云存储: 通过安全URL(CloudFlare R2 CDN)交付音轨
  • 多层级: 为各种用例提供充足的配额
  • 使用跟踪: 实时配额监控

订阅层级与配额

层级 每月分钟数 单文件最大时长 并发请求数
Basic 20分钟 5分钟 1
Pro 200分钟 10分钟 2
Ultra 650分钟 20分钟 5
Mega 2,500分钟 无限制 10

配额详情

  • 每月分钟数: 每个日历月的总音频处理时间
    • 每月1日00:00 UTC重置
    • 跟踪实际音频时长(非处理时间)
  • 单文件最大时长: 单个音频文件的最大长度
    • 硬性限制 - 超过此限制的请求将立即被拒绝
    • 不跨请求累积
  • 配额执行策略:
    1. 单文件限制(硬性):文件不得超过您层级的单文件最大时长
    2. 每月配额(软性,带宽限):
      • 只要您有任何剩余配额(>0分钟),即使文件超过剩余配额,您的请求仍被允许
      • 配额达到0后,所有进一步请求将被阻止,直到下个月

端点

1. 分离音频

  • 端点: POST /api/rapidapi/separate-audio
  • 内容类型: multipart/form-data
  • 请求参数:
    • file(文件,必需):音频或视频文件
  • 成功响应:
    • 状态码:200 OK
    • 响应字段包括:successvocalsUrlinstrumentsUrlmessagecachedfileInfousage
  • 重要提示: 下载链接有效期为48小时,请立即下载并存储音轨

2. 获取使用统计

  • 端点: GET /api/rapidapi/usage
  • 内容类型: application/json
  • 请求: 无需参数,用户身份通过RapidAPI头部识别
  • 成功响应:
    • 状态码:200 OK
    • 响应字段包括:successuserIdsubscriptionmonthminutesUsedmonthlyQuotaremainingrequestCountpercentUsedlastUpdatedresetDatetierInfo

错误响应

  • 400 Bad Request - 未提供文件
  • 400 Bad Request - 时长超出限制
  • 413 Payload Too Large - 文件超过50MB
  • 429 Too Many Requests - 并发请求限制
  • 500 Internal Server Error - 分离失败

支持的文件格式

音频格式

MP3、WAV、FLAC、M4A、AAC、OGG、WebM

视频格式

MP4、WebM、OGG、QuickTime/MOV、AVI、MKV

注意: 对于视频文件,仅提取并处理音轨。输出始终为WAV格式。

输出格式

音轨文件

人声和伴奏均以WAV文件返回,规格如下:

  • 格式: WAV(未压缩)
  • 采样率: 44.1 kHz
  • 位深度: 16-bit
  • 声道: 立体声(2声道)
  • 质量: 工作室级分离

速率限制与配额

每月配额

  • Basic: 20分钟/月
  • Pro: 200分钟/月
  • Ultra: 650分钟/月
  • Mega: 2,500分钟/月

配额每月1日00:00 UTC为所有订阅者重置。

单文件时长限制

  • Basic: 5分钟(300秒)
  • Pro: 10分钟(600秒)
  • Ultra: 20分钟(1,200秒)
  • Mega: 无限制

并发请求

每个用户一次只能处理一个分离请求(可按层级配置)。在处理过程中提交第二个请求将导致429 Too Many Requests错误。

处理时间

  • 平均: 10-60秒,取决于音频长度
  • 冷启动(首次请求): 可能额外需要最多30秒

常见问题

每月配额如何工作?

每月配额以处理的音频分钟数衡量,而非API调用次数。配额每月1日00:00 UTC重置。

如果我超出配额会怎样?

API采用宽松的软限制方法:只要文件不超过您层级的最大时长,您可以继续处理文件。配额达到0后,处理继续但不再扣除额外配额。每月配额仅为信息性,不会阻止请求。

我可以在月中升级层级吗?

可以!升级时:您的新配额立即生效,先前层级任何未使用的配额将被没收,新配额在下个月1日重置。

为什么我会收到并发请求错误?

每个用户一次只能处理一个分离请求(可按层级配置)。请等待当前请求完成后再提交另一个。处理通常需要10-60秒。

下载链接有效期多长?

音轨链接在生成后有效期为48小时。请立即下载并将文件存储到您自己的存储中。

支持

如需技术支持、功能请求或错误报告:

  • 邮箱: support@songfinder.gg
  • 网站: https://songfinder.gg/contact
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该API通过AI技术实现音频文件中人声与乐器的智能分离,可生成纯净人声轨道或制作卡拉OK伴奏,采用先进的音源分离技术。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作