Multilingual Toxicity Checker API
收藏RapidAPI2025-12-24 更新2025-12-03 收录
下载链接:
https://rapidapi.com/smartstack-tech-smartstack-tech-default/api/multilingual-toxicity-checker-api
下载链接
链接失效反馈官方服务:
资源简介:
AI-powered multilingual toxicity detection and content moderation API. Automatically detects toxic content across 15 languages using advanced BERT models and provides word-level analysis with automatic masking.
创建时间:
2025-12-24
原始信息汇总
Multilingual Toxicity Checker API 数据集概述
基本信息
- API名称: Multilingual Toxicity Checker API
- 类别: 文本分析 (Text Analysis)
- 提供商: SmartStack Tech
- 访问地址: https://rapidapi.com/smartstack-tech-smartstack-tech-default/api/multilingual-toxicity-checker-api
- 服务等级: 100%
- 延迟: 1197ms
- 订阅计划: 提供BASIC(免费)、PRO($2.00/月)、ULTRA($5.00/月)、MEGA($10.00/月)四种方案
核心功能
- AI驱动的多语言毒性检测与内容审核API:利用先进的BERT多语言模型,自动检测15种语言的毒性内容,并提供词级分析和自动屏蔽功能。
主要特性
- 支持15种语言:英语、俄语、乌克兰语、德语、西班牙语、阿拉伯语、阿姆哈拉语、印地语、中文、意大利语、法语、Hinglish、希伯来语、日语、鞑靼语。
- AI驱动的检测:使用先进的BERT多语言模型进行准确的毒性分类。
- 词级分析:精确显示哪些词汇贡献了毒性分数。
- 自动屏蔽:响应中自动屏蔽毒性词汇。
- 快速可靠:基于模型的系统,无外部数据集依赖。
端点详情
1. 健康检查
- 端点:
GET health - 用途: 检查服务是否准备好处理请求。
- 响应体示例: json { "status": "ready", "ready": true, "error": null }
2. 获取支持的语言
- 端点:
GET languages - 用途: 返回毒性检测模型支持的所有语言列表。
- 响应体示例: json { "languages": [ { "id": "en", "label": "English", "supported": true, "f1_score": 0.9035 } ] }
3. 分析文本毒性
-
端点:
POST analyze -
用途: 分析文本毒性,自动检测语言,并提供毒性词汇的详细分类。
-
请求体: json { "text": "Your text to analyze here" }
-
响应体示例(清洁文本): json { "language": "en", "classifier": { "score": 0.1234, "severity": "clean", "safe": true, "details": [], "toxic_words": [] }, "masking": { "masked_text": "This is a clean message.", "masked_terms": [] } }
响应字段说明
分类器结果
| 字段 | 类型 | 描述 |
|---|---|---|
score |
数字 | 毒性分数,范围0.0(安全)到1.0(高度毒性) |
severity |
字符串 | 严重级别:clean、low、medium、high |
safe |
布尔值 | 若文本安全(分数 < 0.5)则为true,否则为false |
details |
数组 | 按标签分类的详细分类,显示每个分类贡献的词汇 |
toxic_words |
数组 | 在文本中发现的毒性词汇/短语及其分数列表 |
屏蔽结果
| 字段 | 类型 | 描述 |
|---|---|---|
masked_text |
字符串 | 原始文本,毒性词汇被星号替换 |
masked_terms |
数组 | 被屏蔽的词汇/短语列表 |
语言信息
| 字段 | 类型 | 描述 |
|---|---|---|
id |
字符串 | ISO 639-1语言代码(例如 "en", "ar", "de") |
label |
字符串 | 人类可读的语言名称 |
supported |
布尔值 | 对于列出的语言始终为true |
f1_score |
数字 | 模型对该语言的F1分数(0.0到1.0) |
严重级别定义
| 严重级别 | 分数范围 | 描述 |
|---|---|---|
clean |
0.0 - 0.25 | 文本安全且无毒性 |
low |
0.25 - 0.55 | 检测到轻微毒性 |
medium |
0.55 - 0.85 | 中等毒性 |
high |
0.85 - 1.0 | 检测到高度毒性 |
支持的语言及性能
| 语言 | 代码 | F1分数 |
|---|---|---|
| 英语 | en | 0.9035 |
| 俄语 | ru | 0.9224 |
| 乌克兰语 | uk | 0.9461 |
| 德语 | de | 0.5181 |
| 西班牙语 | es | 0.7291 |
| 阿拉伯语 | ar | 0.5139 |
| 阿姆哈拉语 | am | 0.6316 |
| 印地语 | hi | 0.7268 |
| 中文 | zh | 0.6703 |
| 意大利语 | it | 0.6485 |
| 法语 | fr | 0.9125 |
| Hinglish | hin | 0.6850 |
| 希伯来语 | he | 0.8686 |
| 日语 | ja | 0.8644 |
| 鞑靼语 | tt | 0.6170 |
请求限制
- 最大文本长度: 4000字符
- 最小文本长度: 1字符
错误响应
400 错误请求
json { "detail": "Text is required." }
重要说明
- API使用基于AI模型的检测,无硬编码词汇列表。
- 仅对毒性分数 > 0.5的文本进行屏蔽。
- 词级分析显示具体哪些词汇贡献了毒性。
- 所有分数均在0.0到1.0之间,数值越高表示毒性越强。
- 语言检测是自动的,只需发送文本,API将检测语言并相应分析。如果检测到不支持的语言,API将回退到英语分析。



