Style2Sound - Music Generator From Image Photo API
收藏RapidAPI2025-06-20 更新2025-06-21 收录
下载链接:
https://rapidapi.com/ruinsrover-ruinsrover-default/api/style2sound-music-generator-from-image-photo-api
下载链接
链接失效反馈官方服务:
资源简介:
Upload Image and create song from pixels
创建时间:
2025-06-20
原始信息汇总
Style2Sound - Music Generator From Image Photo API 数据集概述
基本信息
- API名称: Style2Sound - Music Generator From Image Photo API
- 类别: Music
- API提供商: ruinsrover
- 订阅人数: 1
- 服务等级: 100%
- 延迟: 286ms
- 订阅计划:
- BASIC: $0.00 / mo
- PRO: $5.00 / mo
- ULTRA: $10.00 / mo
API概述
Style2Sound是一个AI增强的多媒体API,可将图像转换为独特、富有表现力的音乐作品。它使用基于规则的视觉分析(亮度、对称性、边缘密度等)来识别图像的“情绪”,并据此生成MIDI音乐。
使用场景
- 将用户上传的照片转换为旋律
- 为基于艺术的应用添加生成音频
- 为游戏、博物馆或基于情绪的画廊创建引人入胜的内容
工作原理
- 上传照片
- 引擎分析视觉特征以检测情绪(如平静、充满活力、神秘)
- 系统选择匹配的乐器、节奏和音阶
- 实时生成MIDI文件并作为可下载的音频响应返回
支持的情绪
- Calm Piano
- Mysterious Synth
- Energetic Strings
- Lonely Guitar
- Dreamy Bells
- Dark Bass
输出
- 音频文件(MIDI格式)
- 响应包括检测到的情绪和提取的视觉指标
端点详情
1. /photo-to-music
手动选择乐器、音高范围、分辨率和节奏生成音乐。
端点
POST /photo-to-music
表单参数
| 名称 | 类型 | 默认值 | 描述 |
|---|---|---|---|
image |
file |
— | 输入图像文件 |
instrument |
string |
piano |
乐器选项 |
pitch |
string |
mid |
音高范围: low, mid, high |
resolution |
string |
medium |
图像分析分辨率: coarse, medium, fine |
tempo |
int |
90 |
每分钟节拍数 (BPM), 通常在40–200之间 |
响应
返回可下载的music.mid文件,格式为audio/midi。
2. /photo-to-music-rules
自动分析图像的亮度、边缘密度和对称性以生成音乐。
端点
POST /photo-to-music-rules
情绪决策逻辑
| 检测到的情绪 | 乐器 | 节奏 | 音阶 |
|---|---|---|---|
sakin |
piano | 70 | calm, soft tones |
elektro |
synth | 130 | energetic/electronic |
gitar |
guitar | 100 | warm acoustic melodies |
kaotik |
strings | 150 | intense, dramatic |
响应
- 返回MIDI文件(如
gitar_music.mid) - 包含头部信息:
X-Mood: 检测到的情绪X-Brightness: 平均亮度X-Edge-Density: 视觉复杂度X-Symmetry: 视觉对称性评分
3. /photo-to-music-by-mood
使用预定义的情绪预设立即生成风格化的音乐作品。
端点
POST /photo-to-music-by-mood
表单参数
| 名称 | 类型 | 默认值 | 描述 |
|---|---|---|---|
image |
file |
— | 输入图像 |
resolution |
string |
medium |
图像分析分辨率: coarse, medium, fine |
mood |
string |
mystic |
情绪预设 |
响应
返回photo-mood-music.mid文件,格式为audio/midi。
示例情绪
| 情绪 | 乐器 | 节奏 | 音阶 | 描述 |
|---|---|---|---|---|
mystic |
synth | 60 | phrygian | Dark, mysterious, ambient |
funny |
guitar | 110 | major | Cheerful, playful, light |
sad |
strings | 80 | minor | Emotional, melancholic |
classic |
piano | 90 | major | Balanced, traditional, harmonic |
horror |
choir | 50 | locrian | Scary, tense, eerie |
romance |
harp | 70 | dorian | Gentle, romantic, lyrical |
epic |
trumpet | 140 | mixolydian | Heroic, cinematic, adventurous |
impromptu |
organ | 100 | lydian | Improvised, jazzy, experimental |
peaceful |
flute | 75 | major | Relaxing, airy, spiritual |
输出格式
- 所有响应均为
.mid(MIDI)格式 - 可在任何DAW(数字音频工作站)、钢琴卷帘或合成器中打开
注意事项
- 分辨率影响声音映射的粒度
- 情绪预设抽象了技术选择
- 基于规则的情绪检测是近似和美学上的



