html_tokenizer
收藏RapidAPI2025-07-11 更新2025-02-22 收录
下载链接:
https://rapidapi.com/datadroid/api/html_tokenizer
下载链接
链接失效反馈官方服务:
资源简介:
An api to mark the phrases provided in the html file with help of AI parsing and adaptive learning.
创建时间:
2025-07-11
原始信息汇总
html_tokenizer API 概述
基本信息
- 提供商: datadroid
- 类别: Translation
- 订阅者数量: 3
- API类型: Freemium
- 准确率: 97.4%
- 支持语言: 超过150种
- 文件大小限制:
- 源HTML文件: 小于60MB
- 短语JSON文件: 小于12MB
功能描述
- 该API用于在HTML文件中标记指定的短语,利用先进的AI模型重新校准整个DOM树。
- 支持处理因文件转换导致的复杂DOM结构。
- 使用独特的
phrase_ids精确识别目标标记。
输入参数
- sourceFileLink: 源HTML文件的链接(直接或重定向)。
- phrasesFileLink: 短语JSON文件的链接,格式为对象数组。
-
示例结构: json [{ "phrase": "This is the 1st phrase to mark", "id": "customid_1" }, { "phrase": "This is the 2nd phrase to mark", "id": "customid_2" }]
-
phrase: 需要标记的短语。
-
id: 自定义标记,嵌入DOM中用于识别。
-
输出
- 标记后的HTML文件,短语会被标记为
tokenizer_key,值为对应的id。
订阅计划
- BASIC: $0.00 / 月
- PRO: $149.00 / 月
- ULTRA: $349.00 / 月
- MEGA: $439.00 / 月
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集提供API接口,利用AI解析和自适应学习技术对HTML文件中的短语进行智能标记。
以上内容由遇见数据集搜集并总结生成



