Text-To-Speech
收藏Text-To-Speech API 数据集概述
基本信息
- API名称:Text-To-Speech
- 版本:v1 (current)
- 分类:Text Analysis, Text-To-Speech
- 定价:BASIC - $0.00 / ---
- 提供商:kynesys
- 订阅者数量:1
API 概述
此API支持将文本转换为语音,输出为MP3音频文件或二进制流。二进制缓冲流适用于实时用例,而文件转换适用于近实时用例(音频文件生成前会有几秒延迟)。该API基于Amazon Polly,提供超快速的文本和SSML到音频文件或二进制数据流的转换。
主要功能
- 文本转语音(TTS)转换。
- 支持输出格式:MP3音频文件或音频缓冲流。
- 支持输入类型:纯文本或SSML。
- 使用Amazon Polly服务,支持多种语音和语言。
请求负载定义
json { "Text": "Hello this is a test", // 最大3000字符 "TextType": "text", // 可选值:text 或 ssml "OutputType": "stream", // 可选值:file 或 stream "VoiceId": "Joanna", // 任何AWS Polly支持的语音,默认为Joanna "LanguageCode": "en-GB" // 语音合成的语言代码 }
示例请求负载
json { "Text": "Mary had a little lamb Whose fleece was white as snow", "TextType": "ssml", "OutputType": "file", "VoiceId": "Joanna", "LanguageCode": "en-US" }
响应示例
输出类型为流(stream)
json { "statusCode": 200, "body": {"data":{"type":"Buffer","data":[73,68,51,4,0,0,0,0,0,35,84,83,83,69,0,0,0,15,0,0,....35]}}, "headers": { "Content-Type": "application/json" } }
- 语音数据以缓冲数组形式返回。
- 服务器上不生成或存储文件。
输出类型为文件(file)
json { "statusCode": 200, "body": {"data":"https://ttsapi-538587107323-audiobucket.s3.us-east-1.amazonaws.com/b586047b-dbce-44a9-9463-51c416a3a6d2.mp3?....&x-id=GetObject"}, "headers": { "Content-Type": "application/json" } }
- 生成MP3文件并返回其预签名URL。
- 文件生成过程是异步的,通常查询完成后几秒内可用。
- 返回的URL有效期为80分钟。
- 生成的文件在服务器上保留1天后删除。
相关资源链接
- 语音类型列表:https://docs.aws.amazon.com/polly/latest/dg/voicelist.html
- SSML标签支持:https://docs.aws.amazon.com/polly/latest/dg/supportedtags.html
- 支持的语言代码:https://docs.aws.amazon.com/polly/latest/dg/SupportedLanguage.html
代码示例(使用API响应)
HTML与JavaScript(流输出)
javascript var dataArr = new Uint8Array(bstream); // bstream是OutputType为stream的API响应 var blob = new Blob([dataArr.buffer]); var url = URL.createObjectURL(blob); var audio = document.getElementById(myplayer); audio.src = url;
JavaScript(文件输出)
javascript var audio = document.getElementById(myplayer); audio.src = s3Url; // s3Url是OutputType为file的API响应



