five

Style2Sound - Music Generator From Image Photo API

收藏
RapidAPI2025-06-20 更新2025-06-21 收录
下载链接:
https://rapidapi.com/ruinsrover-ruinsrover-default/api/style2sound-music-generator-from-image-photo-api
下载链接
链接失效反馈
官方服务:
资源简介:
Upload Image and create song from pixels
创建时间:
2025-06-20
原始信息汇总

Style2Sound - Music Generator From Image Photo API 数据集概述

基本信息

  • API名称: Style2Sound - Music Generator From Image Photo API
  • 类别: Music
  • API提供商: ruinsrover
  • 订阅人数: 1
  • 服务等级: 100%
  • 延迟: 286ms
  • 订阅计划:
    • BASIC: $0.00 / mo
    • PRO: $5.00 / mo
    • ULTRA: $10.00 / mo

API概述

Style2Sound是一个AI增强的多媒体API,可将图像转换为独特、富有表现力的音乐作品。它使用基于规则的视觉分析(亮度、对称性、边缘密度等)来识别图像的“情绪”,并据此生成MIDI音乐。

使用场景

  • 将用户上传的照片转换为旋律
  • 为基于艺术的应用添加生成音频
  • 为游戏、博物馆或基于情绪的画廊创建引人入胜的内容

工作原理

  1. 上传照片
  2. 引擎分析视觉特征以检测情绪(如平静、充满活力、神秘)
  3. 系统选择匹配的乐器、节奏和音阶
  4. 实时生成MIDI文件并作为可下载的音频响应返回

支持的情绪

  • Calm Piano
  • Mysterious Synth
  • Energetic Strings
  • Lonely Guitar
  • Dreamy Bells
  • Dark Bass

输出

  • 音频文件(MIDI格式)
  • 响应包括检测到的情绪和提取的视觉指标

端点详情

1. /photo-to-music

手动选择乐器、音高范围、分辨率和节奏生成音乐。

端点

  • POST /photo-to-music

表单参数

名称 类型 默认值 描述
image file 输入图像文件
instrument string piano 乐器选项
pitch string mid 音高范围: low, mid, high
resolution string medium 图像分析分辨率: coarse, medium, fine
tempo int 90 每分钟节拍数 (BPM), 通常在40–200之间

响应

返回可下载的music.mid文件,格式为audio/midi

2. /photo-to-music-rules

自动分析图像的亮度、边缘密度和对称性以生成音乐。

端点

  • POST /photo-to-music-rules

情绪决策逻辑

检测到的情绪 乐器 节奏 音阶
sakin piano 70 calm, soft tones
elektro synth 130 energetic/electronic
gitar guitar 100 warm acoustic melodies
kaotik strings 150 intense, dramatic

响应

  • 返回MIDI文件(如gitar_music.mid
  • 包含头部信息:
    • X-Mood: 检测到的情绪
    • X-Brightness: 平均亮度
    • X-Edge-Density: 视觉复杂度
    • X-Symmetry: 视觉对称性评分

3. /photo-to-music-by-mood

使用预定义的情绪预设立即生成风格化的音乐作品。

端点

  • POST /photo-to-music-by-mood

表单参数

名称 类型 默认值 描述
image file 输入图像
resolution string medium 图像分析分辨率: coarse, medium, fine
mood string mystic 情绪预设

响应

返回photo-mood-music.mid文件,格式为audio/midi

示例情绪

情绪 乐器 节奏 音阶 描述
mystic synth 60 phrygian Dark, mysterious, ambient
funny guitar 110 major Cheerful, playful, light
sad strings 80 minor Emotional, melancholic
classic piano 90 major Balanced, traditional, harmonic
horror choir 50 locrian Scary, tense, eerie
romance harp 70 dorian Gentle, romantic, lyrical
epic trumpet 140 mixolydian Heroic, cinematic, adventurous
impromptu organ 100 lydian Improvised, jazzy, experimental
peaceful flute 75 major Relaxing, airy, spiritual

输出格式

  • 所有响应均为.mid (MIDI)格式
  • 可在任何DAW(数字音频工作站)、钢琴卷帘或合成器中打开

注意事项

  • 分辨率影响声音映射的粒度
  • 情绪预设抽象了技术选择
  • 基于规则的情绪检测是近似和美学上的
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作