five

Multilingual Toxicity Checker API

收藏
RapidAPI2025-12-24 更新2025-12-03 收录
下载链接:
https://rapidapi.com/smartstack-tech-smartstack-tech-default/api/multilingual-toxicity-checker-api
下载链接
链接失效反馈
官方服务:
资源简介:
AI-powered multilingual toxicity detection and content moderation API. Automatically detects toxic content across 15 languages using advanced BERT models and provides word-level analysis with automatic masking.
创建时间:
2025-12-24
原始信息汇总

Multilingual Toxicity Checker API 数据集概述

基本信息

  • API名称: Multilingual Toxicity Checker API
  • 类别: 文本分析 (Text Analysis)
  • 提供商: SmartStack Tech
  • 访问地址: https://rapidapi.com/smartstack-tech-smartstack-tech-default/api/multilingual-toxicity-checker-api
  • 服务等级: 100%
  • 延迟: 1197ms
  • 订阅计划: 提供BASIC(免费)、PRO($2.00/月)、ULTRA($5.00/月)、MEGA($10.00/月)四种方案

核心功能

  • AI驱动的多语言毒性检测与内容审核API:利用先进的BERT多语言模型,自动检测15种语言的毒性内容,并提供词级分析和自动屏蔽功能。

主要特性

  • 支持15种语言:英语、俄语、乌克兰语、德语、西班牙语、阿拉伯语、阿姆哈拉语、印地语、中文、意大利语、法语、Hinglish、希伯来语、日语、鞑靼语。
  • AI驱动的检测:使用先进的BERT多语言模型进行准确的毒性分类。
  • 词级分析:精确显示哪些词汇贡献了毒性分数。
  • 自动屏蔽:响应中自动屏蔽毒性词汇。
  • 快速可靠:基于模型的系统,无外部数据集依赖。

端点详情

1. 健康检查

  • 端点: GET health
  • 用途: 检查服务是否准备好处理请求。
  • 响应体示例: json { "status": "ready", "ready": true, "error": null }

2. 获取支持的语言

  • 端点: GET languages
  • 用途: 返回毒性检测模型支持的所有语言列表。
  • 响应体示例: json { "languages": [ { "id": "en", "label": "English", "supported": true, "f1_score": 0.9035 } ] }

3. 分析文本毒性

  • 端点: POST analyze

  • 用途: 分析文本毒性,自动检测语言,并提供毒性词汇的详细分类。

  • 请求体: json { "text": "Your text to analyze here" }

  • 响应体示例(清洁文本): json { "language": "en", "classifier": { "score": 0.1234, "severity": "clean", "safe": true, "details": [], "toxic_words": [] }, "masking": { "masked_text": "This is a clean message.", "masked_terms": [] } }

响应字段说明

分类器结果

字段 类型 描述
score 数字 毒性分数,范围0.0(安全)到1.0(高度毒性)
severity 字符串 严重级别:cleanlowmediumhigh
safe 布尔值 若文本安全(分数 < 0.5)则为true,否则为false
details 数组 按标签分类的详细分类,显示每个分类贡献的词汇
toxic_words 数组 在文本中发现的毒性词汇/短语及其分数列表

屏蔽结果

字段 类型 描述
masked_text 字符串 原始文本,毒性词汇被星号替换
masked_terms 数组 被屏蔽的词汇/短语列表

语言信息

字段 类型 描述
id 字符串 ISO 639-1语言代码(例如 "en", "ar", "de")
label 字符串 人类可读的语言名称
supported 布尔值 对于列出的语言始终为true
f1_score 数字 模型对该语言的F1分数(0.0到1.0)

严重级别定义

严重级别 分数范围 描述
clean 0.0 - 0.25 文本安全且无毒性
low 0.25 - 0.55 检测到轻微毒性
medium 0.55 - 0.85 中等毒性
high 0.85 - 1.0 检测到高度毒性

支持的语言及性能

语言 代码 F1分数
英语 en 0.9035
俄语 ru 0.9224
乌克兰语 uk 0.9461
德语 de 0.5181
西班牙语 es 0.7291
阿拉伯语 ar 0.5139
阿姆哈拉语 am 0.6316
印地语 hi 0.7268
中文 zh 0.6703
意大利语 it 0.6485
法语 fr 0.9125
Hinglish hin 0.6850
希伯来语 he 0.8686
日语 ja 0.8644
鞑靼语 tt 0.6170

请求限制

  • 最大文本长度: 4000字符
  • 最小文本长度: 1字符

错误响应

400 错误请求

json { "detail": "Text is required." }

重要说明

  • API使用基于AI模型的检测,无硬编码词汇列表。
  • 仅对毒性分数 > 0.5的文本进行屏蔽。
  • 词级分析显示具体哪些词汇贡献了毒性。
  • 所有分数均在0.0到1.0之间,数值越高表示毒性越强。
  • 语言检测是自动的,只需发送文本,API将检测语言并相应分析。如果检测到不支持的语言,API将回退到英语分析。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作