five

BallonsTranslator

收藏
Hugging Face2025-11-10 更新2025-11-10 收录
下载链接:
https://huggingface.co/datasets/dlxjj/BallonsTranslator
下载链接
链接失效反馈
官方服务:
资源简介:
BallonTranslator 是一个深度学习辅助的漫画翻译工具,支持一键机翻和简单的图像/文本编辑。它适用于日漫和美漫,英译中,日译英排版已优化。
创建时间:
2025-11-05
原始信息汇总

BallonTranslator 数据集概述

基本信息

  • 数据集名称: BallonTranslator
  • 核心功能: 深度学习辅助漫画翻译工具,支持一键机翻和图像/文本编辑
  • 支持语言: 简体中文、英文、葡萄牙语、俄语、日语、印尼语、越南语、韩语、西班牙语、法语

核心功能

一键机翻

  • 译文回填参考原文排版估计(颜色、轮廓、角度、朝向、对齐方式)
  • 支持日漫和美漫翻译
  • 优化语言对:英译中、日译英
  • 中文基于pkuseg进行断句
  • 日译中竖排效果待改善

图像编辑

  • 掩膜编辑
  • 修复画笔
  • 矩形工具支持文字抹除

文本编辑

  • 富文本编辑和基础排版格式调整
  • 字体样式预设支持
  • 全文/原文/译文查找替换
  • Word文档导入导出功能
  • 适用于条漫格式

技术架构

自动化模块

  • 文本检测: 支持日文和英文检测,可选YSGDetector模型
  • OCR: 支持mit模型、manga_ocr和星河云服务
  • 图像修复: 提供AOT、patchmatch、lama等算法
  • 翻译器: 支持谷歌、彩云、papago、DeepL、Sugoi、Sakura-13B-Galgame、DeepLX、OpenAI兼容翻译器、m2m100等

硬件加速

  • 默认支持Nvidia显卡和Apple silicon GPU加速
  • 提供AMD ROCm显卡加速方案(ZLUDA和原生社区预览版)

部署方式

Windows系统

  • 预打包版本:从MEGA或Google Drive下载BallonsTranslator_dev_src_with_gitpython.7z
  • 运行launch_win.bat启动程序
  • 不支持Windows 7系统

源码运行

  • 要求Python <= 3.12(非微软应用商店版)和Git
  • 克隆仓库后运行python3 launch.py
  • 首次运行自动安装依赖和下载模型

macOS应用

  • 支持Apple silicon芯片构建
  • 推荐运行源码版本

使用特性

  • 命令行模式支持无GUI运行
  • 支持批量文本格式调整和自动排版
  • 提供丰富的快捷键操作
  • 支持撤销重做功能
  • 集成沙拉查词聚合词典功能

依赖说明

重度依赖manga-image-translator项目,在线服务器和模型训练需要费用支持。

搜集汇总
数据集介绍
main_image_url
构建方式
BallonsTranslator数据集的构建依托于深度学习辅助漫画翻译工具,通过集成文本检测、光学字符识别、图像修复和机器翻译四大模块实现自动化处理。该数据集采用模块化设计,文本检测模块支持日文和英文识别,并兼容第三方服务如星河云检测器;OCR模块整合了manga-image-translator与manga_ocr模型,兼顾多语言识别与颜色提取;翻译模块聚合了谷歌、彩云、Sugoi等多样化引擎,并支持Sakura-13B等大型语言模型。构建过程中注重跨平台兼容性,通过环境配置与模型分发确保数据流水线的稳定性。
特点
该数据集的核心特征在于其高度集成的多模态处理能力,能够对漫画图像中的文本进行端到端分析。译文回填技术可智能还原原文的排版属性,包括字体颜色、轮廓角度与对齐方式,同时支持日漫与美漫的横竖排转换。图像编辑模块提供掩膜修复与矩形工具,文本编辑界面实现富文本实时渲染与批量格式调整。此外,数据集具备跨语言适应性,针对英译中、日译英场景优化布局算法,并依托pkuseg实现中文智能断句,显著提升了翻译结果的可读性与视觉一致性。
使用方法
用户可通过图形界面或命令行模式调用数据集功能,启动后需配置源语言与目标语言参数,并加载包含漫画图像的文件夹。一键翻译流程自动执行文本检测、识别、抹除及机翻操作,译文将根据全局字体设置或原文字体属性动态渲染。图像编辑工具支持修复画笔与矩形选区,文本编辑器提供查找替换、字体样式预设及Word文档导入导出功能。针对高性能计算需求,数据集支持NVIDIA GPU与AMD ROCm加速,并通过ZLUDA技术优化异构计算环境下的推理效率。
背景与挑战
背景概述
随着数字漫画在全球范围内的广泛传播,跨语言文化交流需求日益增长,传统人工翻译模式在效率与成本上面临显著瓶颈。BallonsTranslator项目由开发者社区于2022年发起,旨在通过深度学习技术构建自动化漫画翻译解决方案。该工具整合文本检测、光学字符识别、图像修复与机器翻译模块,支持多语言互译与图文编辑功能,其创新性在于将译文智能适配原始漫画气泡的视觉样式,显著提升了数字化漫画的本地化效率。
当前挑战
该数据集构建面临多模态技术融合的复杂性:文本检测需精准区分漫画图像中的文字区域与艺术元素,尤其在拟声词与复杂背景交织场景中易产生误判;跨语言翻译需兼顾文化语境适配与排版约束,如中文断句与竖排文本处理尚存优化空间。技术实现层面,图像修复模块对文字清除与背景重建的平衡要求极高,而离线翻译模型的部署受硬件资源限制,轻量化与精度难以兼得。
常用场景
经典使用场景
在跨语言漫画传播领域,BallonsTranslator凭借其深度学习技术实现了漫画文本的自动化翻译与排版重构。该工具通过集成文本检测、光学字符识别、图像修复及机器翻译模块,能够智能识别漫画气泡内的原文内容,并基于原始排版特征自动生成符合目标语言习惯的译文布局。其经典应用体现在对日式漫画与美式漫画的双重适配,特别是在日英、英中语言对的转换过程中,通过pkuseg中文断句技术与背景泡参考机制,有效维持了漫画视觉叙事的连贯性。
实际应用
在实际应用层面,BallonsTranslator已成为漫画爱好者与本地化团队的高效辅助工具。它不仅支持条漫与页漫的批量处理,还提供掩膜编辑、修复画笔等实用功能,显著提升了漫画本地化的工作效率。通过集成谷歌翻译、彩云小译等多引擎支持,以及Sakura-13B等大语言模型,满足了不同场景下的翻译质量需求。其Word文档导入导出特性更实现了与传统翻译工作流的无缝衔接,在民间汉化组与商业本地化公司中均得到广泛应用。
衍生相关工作
该项目衍生出多个具有影响力的相关研究,其中manga-image-translator作为核心依赖项持续优化着文本检测与翻译性能。基于comic-text-detector的改进模型YSGDetector有效提升了拟声词过滤能力,而PyPatchMatchInpaint的非深度学习修复算法则为图像处理领域提供了新思路。在翻译模块方面,Sugoi离线翻译器与Sakura-13B大模型的集成推动了低资源语言对的翻译研究,这些衍生工作共同构成了漫画机器翻译领域的技术生态体系。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作