five

CleanText Pro – Advanced Text Cleaner API

收藏
RapidAPI2025-12-10 更新2025-12-10 收录
下载链接:
https://rapidapi.com/nikitadanilovkz/api/cleantext-pro-advanced-text-cleaner-api
下载链接
链接失效反馈
官方服务:
资源简介:
Clean and normalize text: remove HTML, URLs, emojis, punctuation, numbers; detect language and get tokens in one API call.
创建时间:
2025-12-10
原始信息汇总

CleanText Pro – Advanced Text Cleaner API 数据集概述

基本信息

  • API名称:CleanText Pro – Advanced Text Cleaner API
  • 类别:Text Analysis
  • 提供者:Niki
  • 订阅者数量:1
  • 流行度:8.4
  • 服务等级:100%
  • 延迟:228ms
  • 测试状态:50%

定价计划

  • BASIC:$0.00 / mo
  • PRO:$5.00 / mo
  • ULTRA:$15.00 / mo
  • MEGA:$49.00 / mo

功能概述

CleanText Pro 是一个强大且灵活的 REST API,旨在为 NLP 管道、AI 模型、SEO 系统、网络爬虫、数据分析或任何文本处理工作流程清理和规范化原始文本。

核心功能

  • 移除 HTML 标签(<div><p><b> 等)
  • 解码 HTML 实体(&amp;&
  • 移除 URL(https://...www...
  • 移除表情符号和大多数符号字符
  • 移除标点符号(可选)
  • 移除数字(可选)
  • 移除非 ASCII 字符(可选)
  • 清理 Markdown 标记(# headers*bold*_italic_、列表)
  • 规范化空白字符(多个空格 → 一个)
  • 转换文本大小写(lower / upper / title / none
  • 可选返回 tokens(单词列表)
  • 可选检测 languageenrude 等)
  • 支持 max_length 修剪
  • 支持 GETPOST 方法

最佳应用场景

  • AI / NLP 模型 预处理文本
  • 清理 用户评论 中的 HTML、链接和噪音
  • 清理 爬取的网站内容
  • 为市场平台准备产品描述
  • 在分析前规范化大型数据集
  • 清理日志和原始文本文件

技术详情

  • Base URL:https://text-cleaner-api-production.up.railway.app
  • 版本:v1 (current)

核心端点

  • GET /health — API 状态检查
  • GET / — API 信息(名称、版本、文档)
  • GET /clean — 通过查询参数清理文本
  • POST /clean — 通过 JSON 请求体清理文本(推荐用于生产环境)

示例请求 (POST)

bash curl -X POST "https://text-cleaner-api-production.up.railway.app/clean" -H "Content-Type: application/json" -d { "text": "<h1>YO БРО!!! 👋</h1> Visit https://spam.ru NOW!!!", "case": "lower", "remove_html": true, "decode_html_entities": true, "strip_markdown": true, "remove_urls": true, "remove_emojis": true, "remove_punctuation": true, "remove_numbers": true, "normalize_whitespace": true, "return_tokens": true, "detect_language": true }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作