CleanText Pro – Advanced Text Cleaner API
收藏RapidAPI2025-12-10 更新2025-12-10 收录
下载链接:
https://rapidapi.com/nikitadanilovkz/api/cleantext-pro-advanced-text-cleaner-api
下载链接
链接失效反馈官方服务:
资源简介:
Clean and normalize text: remove HTML, URLs, emojis, punctuation, numbers; detect language and get tokens in one API call.
创建时间:
2025-12-10
原始信息汇总
CleanText Pro – Advanced Text Cleaner API 数据集概述
基本信息
- API名称:CleanText Pro – Advanced Text Cleaner API
- 类别:Text Analysis
- 提供者:Niki
- 订阅者数量:1
- 流行度:8.4
- 服务等级:100%
- 延迟:228ms
- 测试状态:50%
定价计划
- BASIC:$0.00 / mo
- PRO:$5.00 / mo
- ULTRA:$15.00 / mo
- MEGA:$49.00 / mo
功能概述
CleanText Pro 是一个强大且灵活的 REST API,旨在为 NLP 管道、AI 模型、SEO 系统、网络爬虫、数据分析或任何文本处理工作流程清理和规范化原始文本。
核心功能
- 移除 HTML 标签(
<div>、<p>、<b>等) - 解码 HTML 实体(
&→&) - 移除 URL(
https://...、www...) - 移除表情符号和大多数符号字符
- 移除标点符号(可选)
- 移除数字(可选)
- 移除非 ASCII 字符(可选)
- 清理 Markdown 标记(
# headers、*bold*、_italic_、列表) - 规范化空白字符(多个空格 → 一个)
- 转换文本大小写(lower / upper / title / none)
- 可选返回 tokens(单词列表)
- 可选检测 language(
en、ru、de等) - 支持 max_length 修剪
- 支持
GET和POST方法
最佳应用场景
- 为 AI / NLP 模型 预处理文本
- 清理 用户评论 中的 HTML、链接和噪音
- 清理 爬取的网站内容
- 为市场平台准备产品描述
- 在分析前规范化大型数据集
- 清理日志和原始文本文件
技术详情
- Base URL:https://text-cleaner-api-production.up.railway.app
- 版本:v1 (current)
核心端点
GET /health— API 状态检查GET /— API 信息(名称、版本、文档)GET /clean— 通过查询参数清理文本POST /clean— 通过 JSON 请求体清理文本(推荐用于生产环境)
示例请求 (POST)
bash curl -X POST "https://text-cleaner-api-production.up.railway.app/clean" -H "Content-Type: application/json" -d { "text": "<h1>YO БРО!!! 👋</h1> Visit https://spam.ru NOW!!!", "case": "lower", "remove_html": true, "decode_html_entities": true, "strip_markdown": true, "remove_urls": true, "remove_emojis": true, "remove_punctuation": true, "remove_numbers": true, "normalize_whitespace": true, "return_tokens": true, "detect_language": true }



