five

PATIMT-Bench位置感知图文多模态机器翻译的图文标注数据

收藏
国家基础学科公共科学数据中心2025-11-29 收录
下载链接:
https://nbsdc.cn/general/dataDetail?id=69248120195d26651c427bc2&type=1
下载链接
链接失效反馈
官方服务:
资源简介:
PATIMT-Bench主要面向位置感知的图文机器翻译研究,为图文机器翻译提供一个面向多场景,带定位的数据集与评测基准,旨在支持图文翻译模型在多种真实应用场景下实现高质量、布局保持的翻译。该数据集包含 10 种真实世界场景(包括广告、海报、书籍封面、自然场景、街景、图表、表格、手写、信息图和文档),覆盖了从文本数量,布局复杂度从低到高的多样化样本。本数据集采用json格式整理发布,基于现有开源的图文数据集产生,内容主要包含图片,图片中文字的OCR结果,以及文字对应定位框位置和译文。数据量为16.5GB
提供机构:
厦门大学
二维码
社区交流群
二维码
科研交流群
商业服务