Google Cloud Speech-to-Text
收藏Google Cloud Speech-to-Text API 数据集概述
基本信息
- API名称:Google Cloud Speech-to-Text
- 提供平台:RapidAPI
- 提供商:frequency404
- 类别:Media
- 当前版本:v1
- 订阅计划:
- BASIC:$0.00 / 月
- PRO:$10.00 / 月
- ULTRA:$100.00 / 月
- MEGA:$1,000.00 / 月
核心功能
- 语音转文本:将音频转换为文本。
- 支持语言:125种以上语言。
- 音频格式支持:MP3、FLAC、WAV、OGG等。
- 自动标点:自动为转录文本添加标点符号。
- 说话人分离:支持说话人日记化(speaker diarization)。
- 高准确率:采用谷歌最新的语音识别模型。
- 技术支持:基于谷歌云技术,与Google Assistant同源。
端点信息
- 端点:
stt/recognize - 方法:POST
- 功能:语音识别
快速开始示例
Python
python import requests import base64
url = "https://google-cloud-stt.p.rapidapi.com/stt/recognize" headers = { "x-rapidapi-key": "YOUR_RAPIDAPI_KEY", "x-rapidapi-host": "google-cloud-stt.p.rapidapi.com", "Content-Type": "application/json" }
with open("audio.mp3", "rb") as f: audio_b64 = base64.b64encode(f.read()).decode()
payload = { "audio": audio_b64, "language": "en-US", "encoding": "MP3", "sample_rate": 16000 }
response = requests.post(url, json=payload, headers=headers) data = response.json() print(f"Transcript: {data[transcript]}")
cURL
bash curl -X POST "https://google-cloud-stt.p.rapidapi.com/stt/recognize" -H "x-rapidapi-key: YOUR_RAPIDAPI_KEY" -H "Content-Type: application/json" -d {"audio_url": "gs://cloud-samples-tests/speech/brooklyn.flac", "language": "en-US", "encoding": "FLAC"}
提供商信息
- API创建者:frequency404
- 订阅者数量:1
相关链接
- Playground:https://rapidapi.com/nexaquency/api/google-cloud-speech-to-text1
- 提供商链接:https://nexa-api.com



