GlyphByT5/GlyphByT5Pretraining
收藏数据集卡片 for GlyphByT5Pretraining
数据集概述
该数据集包含用于Glyph-ByT5中引入的字形对齐预训练阶段的数据。数据集包含100K排版数据注释,可用于渲染视觉文本。
数据集来源
- 仓库: [https://github.com/AIGText/Glyph-ByT5]
- 论文: [https://arxiv.org/abs/2403.09622]
- 项目页面: [https://glyph-byt5.github.io/]
数据集结构
数据集包含一个json文件,其中包含详细注释。每个注释的组织结构如下:
json { "texts": [ "text string 1", "text string 2", ... "text string k" ], "styles": [ { color: color 1, # 一个表示颜色的十六进制代码 font-family: font 1 # 表示字体的字体代码 }, { color: color 2, font-family: font 2 }, ... { color: color k, font-family: font k }, ], "bbox": [ [x1, y1, w1, h1, a1], # 绝对坐标在[0, 1645]之间 [x2, y2, w2, h2, a2], ... [xk, yk, wk, hk, ak] ] }
使用
引用
如果您发现我们的工作对您的研究有用,请考虑引用:
plaintext @misc{liu2024glyphbyt5, title={Glyph-ByT5: A Customized Text Encoder for Accurate Visual Text Rendering}, author={Zeyu Liu and Weicong Liang and Zhanhao Liang and Chong Luo and Ji Li and Gao Huang and Yuhui Yuan}, year={2024}, eprint={2403.09622}, archivePrefix={arXiv}, primaryClass={cs.CV} }



