thatAPI - Language Detector
收藏thatAPI - Language Detector 数据集概述
基本信息
- 数据集名称:thatAPI - Language Detector
- 类别:Text Analysis
- 提供商:thatAPI
- 订阅者数量:1
- 流行度:8.8
- 服务等级:100%
- 延迟:97ms
- 测试通过率:100%
订阅计划
- BASIC:$0.00 / 月
- PRO:$9.99 / 月
- ULTRA:$29.99 / 月
- MEGA:$69.99 / 月
API 概述
该语言检测 API 可识别任何文本的语言,返回语言代码、名称、置信度分数、书写脚本和替代检测结果。
主要特性
- 检测 75 种以上语言,并提供置信度评分
- 书写脚本检测:拉丁文、西里尔文、阿拉伯文、CJK、韩文、天城文等
- 可靠性标志,用于指示结果是确信的还是不确定的
- 前 5 个替代语言匹配及其置信度分数
- 批处理模式,可在单个请求中检测多个文本
- 适用于短文本(甚至单个句子)
技术基础
由 lingua 库提供支持,准确性高,尤其在短文本检测方面表现优异。
端点
- 方法:POST
- 路径:
/v1/language-detection/detect
请求参数
| 字段 | 类型 | 必需 | 描述 |
|---|---|---|---|
text |
字符串 | text 或 texts 二选一 |
要检测的单个文本 |
texts |
字符串数组 | text 或 texts 二选一 |
要检测的批处理文本 |
请求示例
单个文本 json { "text": "Bonjour le monde, comment allez-vous aujourdhui?" }
批处理模式 json { "texts": ["Hello world", "Hola mundo", "Bonjour le monde"] }
响应结构
单个文本响应
json { "language_code": "fr", "language_name": "French", "confidence": 0.9847, "is_reliable": true, "script": "Latin", "all_detections": [ {"language_code": "fr", "language_name": "French", "confidence": 0.9847}, {"language_code": "it", "language_name": "Italian", "confidence": 0.0089}, {"language_code": "es", "language_name": "Spanish", "confidence": 0.0032} ] }
批处理模式响应
json { "results": [ {"language_code": "en", "language_name": "English", "confidence": 0.98, "is_reliable": true, "script": "Latin", "all_detections": [...]}, {"language_code": "es", "language_name": "Spanish", "confidence": 0.95, "is_reliable": true, "script": "Latin", "all_detections": [...]}, {"language_code": "fr", "language_name": "French", "confidence": 0.97, "is_reliable": true, "script": "Latin", "all_detections": [...]} ] }
响应字段说明
| 字段 | 类型 | 描述 |
|---|---|---|
language_code |
字符串或 null | ISO 639-1 代码(例如 en, es, fr, de, zh, ja) |
language_name |
字符串或 null | 人类可读的名称(例如 English, Spanish) |
confidence |
浮点数 | 检测置信度,范围从 0.0 到 1.0 |
is_reliable |
布尔值 | 当置信度超过 0.5 时为 true |
script |
字符串 | 书写系统:拉丁文、西里尔文、阿拉伯文、CJK、韩文、天城文、希腊文、希伯来文、泰文等 |
all_detections |
数组 | 前 5 个语言候选及其置信度分数 |
支持的脚本
拉丁文、西里尔文、阿拉伯文、CJK(中文/日文/韩文)、韩文、日文(平假名/片假名)、天城文、希腊文、希伯来文、泰文、格鲁吉亚文、亚美尼亚文、孟加拉文、泰米尔文、泰卢固文。
空文本处理
传递 {"text": ""} 会返回 language_code: null, is_reliable: false。
错误响应
| 状态码 | 触发条件 |
|---|---|
| 422 | 未提供 text 或 texts 参数 |
使用案例
- 国际化:将内容路由到正确的翻译流程
- 内容审核:在应用特定语言规则之前检测语言
- 客户支持:自动检测工单语言以进行座席路由
- 数据清洗:识别和分离多语言数据集
- AI 流程:使用语言适当的标记器预处理文本



