five

GlyphByT5/GlyphByT5Pretraining

收藏
Hugging Face2024-07-10 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/GlyphByT5/GlyphByT5Pretraining
下载链接
链接失效反馈
官方服务:
资源简介:
GlyphByT5Pretraining数据集包含用于Glyph-ByT5模型预训练阶段的100,000个排版数据标注,这些标注可用于生成视觉文本。数据集结构包括一个JSON文件,其中每个标注包含文本、样式(颜色和字体家族)和边界框信息。

GlyphByT5Pretraining数据集包含用于Glyph-ByT5模型预训练阶段的100,000个排版数据标注,这些标注可用于生成视觉文本。数据集结构包括一个JSON文件,其中每个标注包含文本、样式(颜色和字体家族)和边界框信息。
提供机构:
GlyphByT5
原始信息汇总

数据集卡片 for GlyphByT5Pretraining

数据集概述

该数据集包含用于Glyph-ByT5中引入的字形对齐预训练阶段的数据。数据集包含100K排版数据注释,可用于渲染视觉文本。

数据集来源

  • 仓库: [https://github.com/AIGText/Glyph-ByT5]
  • 论文: [https://arxiv.org/abs/2403.09622]
  • 项目页面: [https://glyph-byt5.github.io/]

数据集结构

数据集包含一个json文件,其中包含详细注释。每个注释的组织结构如下:

json { "texts": [ "text string 1", "text string 2", ... "text string k" ], "styles": [ { color: color 1, # 一个表示颜色的十六进制代码 font-family: font 1 # 表示字体的字体代码 }, { color: color 2, font-family: font 2 }, ... { color: color k, font-family: font k }, ], "bbox": [ [x1, y1, w1, h1, a1], # 绝对坐标在[0, 1645]之间 [x2, y2, w2, h2, a2], ... [xk, yk, wk, hk, ak] ] }

使用

更多详细信息请参阅我们的论文项目页面

引用

如果您发现我们的工作对您的研究有用,请考虑引用:

plaintext @misc{liu2024glyphbyt5, title={Glyph-ByT5: A Customized Text Encoder for Accurate Visual Text Rendering}, author={Zeyu Liu and Weicong Liang and Zhanhao Liang and Chong Luo and Ji Li and Gao Huang and Yuhui Yuan}, year={2024}, eprint={2403.09622}, archivePrefix={arXiv}, primaryClass={cs.CV} }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作