Multilingual Toxicity Checker API

RapidAPI2025-12-24 更新2025-12-03 收录

下载链接：

https://rapidapi.com/smartstack-tech-smartstack-tech-default/api/multilingual-toxicity-checker-api

下载链接

链接失效反馈

官方服务：

资源简介：

AI-powered multilingual toxicity detection and content moderation API. Automatically detects toxic content across 15 languages using advanced BERT models and provides word-level analysis with automatic masking.

创建时间：

2025-12-24

原始信息汇总

Multilingual Toxicity Checker API 数据集概述

基本信息

API名称: Multilingual Toxicity Checker API
类别: 文本分析 (Text Analysis)
提供商: SmartStack Tech
访问地址: https://rapidapi.com/smartstack-tech-smartstack-tech-default/api/multilingual-toxicity-checker-api
服务等级: 100%
延迟: 1197ms
订阅计划: 提供BASIC（免费）、PRO（$2.00/月）、ULTRA（$5.00/月）、MEGA（$10.00/月）四种方案

核心功能

AI驱动的多语言毒性检测与内容审核API：利用先进的BERT多语言模型，自动检测15种语言的毒性内容，并提供词级分析和自动屏蔽功能。

主要特性

支持15种语言：英语、俄语、乌克兰语、德语、西班牙语、阿拉伯语、阿姆哈拉语、印地语、中文、意大利语、法语、Hinglish、希伯来语、日语、鞑靼语。
AI驱动的检测：使用先进的BERT多语言模型进行准确的毒性分类。
词级分析：精确显示哪些词汇贡献了毒性分数。
自动屏蔽：响应中自动屏蔽毒性词汇。
快速可靠：基于模型的系统，无外部数据集依赖。

端点详情

1. 健康检查

端点: GET health
用途: 检查服务是否准备好处理请求。
响应体示例: json { "status": "ready", "ready": true, "error": null }

2. 获取支持的语言

端点: GET languages
用途: 返回毒性检测模型支持的所有语言列表。
响应体示例: json { "languages": [ { "id": "en", "label": "English", "supported": true, "f1_score": 0.9035 } ] }

3. 分析文本毒性

端点: POST analyze
用途: 分析文本毒性，自动检测语言，并提供毒性词汇的详细分类。
请求体: json { "text": "Your text to analyze here" }
响应体示例（清洁文本）: json { "language": "en", "classifier": { "score": 0.1234, "severity": "clean", "safe": true, "details": [], "toxic_words": [] }, "masking": { "masked_text": "This is a clean message.", "masked_terms": [] } }

响应字段说明

分类器结果

字段	类型	描述
`score`	数字	毒性分数，范围0.0（安全）到1.0（高度毒性）
`severity`	字符串	严重级别：`clean`、`low`、`medium`、`high`
`safe`	布尔值	若文本安全（分数 < 0.5）则为`true`，否则为`false`
`details`	数组	按标签分类的详细分类，显示每个分类贡献的词汇
`toxic_words`	数组	在文本中发现的毒性词汇/短语及其分数列表

屏蔽结果

字段	类型	描述
`masked_text`	字符串	原始文本，毒性词汇被星号替换
`masked_terms`	数组	被屏蔽的词汇/短语列表

语言信息

字段	类型	描述
`id`	字符串	ISO 639-1语言代码（例如 "en", "ar", "de"）
`label`	字符串	人类可读的语言名称
`supported`	布尔值	对于列出的语言始终为`true`
`f1_score`	数字	模型对该语言的F1分数（0.0到1.0）

严重级别定义

严重级别	分数范围	描述
`clean`	0.0 - 0.25	文本安全且无毒性
`low`	0.25 - 0.55	检测到轻微毒性
`medium`	0.55 - 0.85	中等毒性
`high`	0.85 - 1.0	检测到高度毒性

支持的语言及性能

语言	代码	F1分数
英语	en	0.9035
俄语	ru	0.9224
乌克兰语	uk	0.9461
德语	de	0.5181
西班牙语	es	0.7291
阿拉伯语	ar	0.5139
阿姆哈拉语	am	0.6316
印地语	hi	0.7268
中文	zh	0.6703
意大利语	it	0.6485
法语	fr	0.9125
Hinglish	hin	0.6850
希伯来语	he	0.8686
日语	ja	0.8644
鞑靼语	tt	0.6170

请求限制

最大文本长度: 4000字符
最小文本长度: 1字符

错误响应

400 错误请求

json { "detail": "Text is required." }

重要说明

API使用基于AI模型的检测，无硬编码词汇列表。
仅对毒性分数 > 0.5的文本进行屏蔽。
词级分析显示具体哪些词汇贡献了毒性。
所有分数均在0.0到1.0之间，数值越高表示毒性越强。
语言检测是自动的，只需发送文本，API将检测语言并相应分析。如果检测到不支持的语言，API将回退到英语分析。

5,000+

优质数据集

54 个

任务类型

进入经典数据集