five

html_tokenizer

收藏
RapidAPI2025-07-11 更新2025-02-22 收录
下载链接:
https://rapidapi.com/datadroid/api/html_tokenizer
下载链接
链接失效反馈
官方服务:
资源简介:
An api to mark the phrases provided in the html file with help of AI parsing and adaptive learning.
创建时间:
2025-07-11
原始信息汇总

html_tokenizer API 概述

基本信息

  • 提供商: datadroid
  • 类别: Translation
  • 订阅者数量: 3
  • API类型: Freemium
  • 准确率: 97.4%
  • 支持语言: 超过150种
  • 文件大小限制:
    • 源HTML文件: 小于60MB
    • 短语JSON文件: 小于12MB

功能描述

  • 该API用于在HTML文件中标记指定的短语,利用先进的AI模型重新校准整个DOM树。
  • 支持处理因文件转换导致的复杂DOM结构。
  • 使用独特的phrase_ids精确识别目标标记。

输入参数

  1. sourceFileLink: 源HTML文件的链接(直接或重定向)。
  2. phrasesFileLink: 短语JSON文件的链接,格式为对象数组。
    • 示例结构: json [{ "phrase": "This is the 1st phrase to mark", "id": "customid_1" }, { "phrase": "This is the 2nd phrase to mark", "id": "customid_2" }]

    • phrase: 需要标记的短语。

    • id: 自定义标记,嵌入DOM中用于识别。

输出

  • 标记后的HTML文件,短语会被标记为tokenizer_key,值为对应的id

订阅计划

  • BASIC: $0.00 / 月
  • PRO: $149.00 / 月
  • ULTRA: $349.00 / 月
  • MEGA: $439.00 / 月
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集提供API接口,利用AI解析和自适应学习技术对HTML文件中的短语进行智能标记。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作