five

thatAPI - Language Detector

收藏
RapidAPI2026-03-31 更新2026-04-01 收录
下载链接:
https://rapidapi.com/zetafuncZ/api/thatapi-language-detector
下载链接
链接失效反馈
官方服务:
资源简介:
Detect language from text with confidence scoring. Supports 75+ languages, script detection (Latin, Cyrillic, CJK, Arabic), and batch mode.
创建时间:
2026-03-31
原始信息汇总

thatAPI - Language Detector 数据集概述

基本信息

  • 数据集名称:thatAPI - Language Detector
  • 类别:Text Analysis
  • 提供商:thatAPI
  • 订阅者数量:1
  • 流行度:8.8
  • 服务等级:100%
  • 延迟:97ms
  • 测试通过率:100%

订阅计划

  • BASIC:$0.00 / 月
  • PRO:$9.99 / 月
  • ULTRA:$29.99 / 月
  • MEGA:$69.99 / 月

API 概述

该语言检测 API 可识别任何文本的语言,返回语言代码、名称、置信度分数、书写脚本和替代检测结果。

主要特性

  • 检测 75 种以上语言,并提供置信度评分
  • 书写脚本检测:拉丁文、西里尔文、阿拉伯文、CJK、韩文、天城文等
  • 可靠性标志,用于指示结果是确信的还是不确定的
  • 前 5 个替代语言匹配及其置信度分数
  • 批处理模式,可在单个请求中检测多个文本
  • 适用于短文本(甚至单个句子)

技术基础

由 lingua 库提供支持,准确性高,尤其在短文本检测方面表现优异。

端点

  • 方法:POST
  • 路径/v1/language-detection/detect

请求参数

字段 类型 必需 描述
text 字符串 texttexts 二选一 要检测的单个文本
texts 字符串数组 texttexts 二选一 要检测的批处理文本

请求示例

单个文本 json { "text": "Bonjour le monde, comment allez-vous aujourdhui?" }

批处理模式 json { "texts": ["Hello world", "Hola mundo", "Bonjour le monde"] }

响应结构

单个文本响应

json { "language_code": "fr", "language_name": "French", "confidence": 0.9847, "is_reliable": true, "script": "Latin", "all_detections": [ {"language_code": "fr", "language_name": "French", "confidence": 0.9847}, {"language_code": "it", "language_name": "Italian", "confidence": 0.0089}, {"language_code": "es", "language_name": "Spanish", "confidence": 0.0032} ] }

批处理模式响应

json { "results": [ {"language_code": "en", "language_name": "English", "confidence": 0.98, "is_reliable": true, "script": "Latin", "all_detections": [...]}, {"language_code": "es", "language_name": "Spanish", "confidence": 0.95, "is_reliable": true, "script": "Latin", "all_detections": [...]}, {"language_code": "fr", "language_name": "French", "confidence": 0.97, "is_reliable": true, "script": "Latin", "all_detections": [...]} ] }

响应字段说明

字段 类型 描述
language_code 字符串或 null ISO 639-1 代码(例如 en, es, fr, de, zh, ja
language_name 字符串或 null 人类可读的名称(例如 English, Spanish
confidence 浮点数 检测置信度,范围从 0.0 到 1.0
is_reliable 布尔值 当置信度超过 0.5 时为 true
script 字符串 书写系统:拉丁文、西里尔文、阿拉伯文、CJK、韩文、天城文、希腊文、希伯来文、泰文等
all_detections 数组 前 5 个语言候选及其置信度分数

支持的脚本

拉丁文、西里尔文、阿拉伯文、CJK(中文/日文/韩文)、韩文、日文(平假名/片假名)、天城文、希腊文、希伯来文、泰文、格鲁吉亚文、亚美尼亚文、孟加拉文、泰米尔文、泰卢固文。

空文本处理

传递 {"text": ""} 会返回 language_code: null, is_reliable: false

错误响应

状态码 触发条件
422 未提供 texttexts 参数

使用案例

  • 国际化:将内容路由到正确的翻译流程
  • 内容审核:在应用特定语言规则之前检测语言
  • 客户支持:自动检测工单语言以进行座席路由
  • 数据清洗:识别和分离多语言数据集
  • AI 流程:使用语言适当的标记器预处理文本
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作