AnyText评测集

Name: AnyText评测集
Creator: maas
Published: 2026-05-14 10:34:12
License: 暂无描述

魔搭社区2026-05-14 更新2024-05-15 收录

下载链接：

https://modelscope.cn/datasets/iic/AnyText-benchmark

下载链接

链接失效反馈

官方服务：

资源简介：

## 数据集简介 AnyText-benchmark是多语言视觉文字生成与编辑模型AnyText所提供的评测集，采用三种评价方法用于评测文字生成方法的性能，包括OCR相关的Sentence Accuracy, Normalized Edit Distance指标，以及图像真实性相关的FID指标。该评测集目前包含中文和英文两种语言的数据，其中OCR部分的规模是中英各1000张图片，FID部分的规模是中英各4万张。评测方法细节及代码请参考[论文](https://arxiv.org/abs/2311.03054)及[代码](https://github.com/tyxsspa/AnyText)。 20250228更新：补充了AnyText2使用的long caption版本的benchmark, 参考[论文](https://arxiv.org/abs/2411.15245)及[代码](https://github.com/tyxsspa/AnyText2)。 ### Clone with HTTP ```bash git clone https://www.modelscope.cn/datasets/iic/AnyText-benchmark.git ```

### 数据集简介 AnyText-benchmark评测基准集是多语言视觉文字生成与编辑模型AnyText推出的专属评测集，其采用三类评测方法以全面评估文字生成模型的性能，涵盖与光学字符识别（OCR, Optical Character Recognition）相关的句子准确率（Sentence Accuracy）、归一化编辑距离（Normalized Edit Distance）指标，以及与图像真实性相关的弗雷歇特初始距离（FID, Fréchet Inception Distance）指标。该评测基准集当前包含中文与英文两类语言数据：其中OCR评测子集的规模为中英各1000张图像，FID评测子集的规模则为中英各40000张图像。关于评测方法的详细细节与代码实现，请参考[论文](https://arxiv.org/abs/2311.03054)及[代码仓库](https://github.com/tyxsspa/AnyText)。 2025年2月28日更新：本次更新补充了适配AnyText2使用的长描述（long caption）版本评测基准集，相关信息可参考[论文](https://arxiv.org/abs/2411.15245)及[代码仓库](https://github.com/tyxsspa/AnyText2)。 ### 通过HTTP协议克隆 bash git clone https://www.modelscope.cn/datasets/iic/AnyText-benchmark.git

提供机构：

maas

创建时间：

2024-02-20

搜集汇总

数据集介绍