five

AnyText评测集

收藏
魔搭社区2026-05-14 更新2024-05-15 收录
下载链接:
https://modelscope.cn/datasets/iic/AnyText-benchmark
下载链接
链接失效反馈
官方服务:
资源简介:
## 数据集简介 AnyText-benchmark是多语言视觉文字生成与编辑模型AnyText所提供的评测集,采用三种评价方法用于评测文字生成方法的性能,包括OCR相关的Sentence Accuracy, Normalized Edit Distance指标,以及图像真实性相关的FID指标。该评测集目前包含中文和英文两种语言的数据,其中OCR部分的规模是中英各1000张图片,FID部分的规模是中英各4万张。评测方法细节及代码请参考[论文](https://arxiv.org/abs/2311.03054)及[代码](https://github.com/tyxsspa/AnyText)。 20250228更新:补充了AnyText2使用的long caption版本的benchmark, 参考[论文](https://arxiv.org/abs/2411.15245)及[代码](https://github.com/tyxsspa/AnyText2)。 ### Clone with HTTP ```bash git clone https://www.modelscope.cn/datasets/iic/AnyText-benchmark.git ```

### 数据集简介 AnyText-benchmark评测基准集是多语言视觉文字生成与编辑模型AnyText推出的专属评测集,其采用三类评测方法以全面评估文字生成模型的性能,涵盖与光学字符识别(OCR, Optical Character Recognition)相关的句子准确率(Sentence Accuracy)、归一化编辑距离(Normalized Edit Distance)指标,以及与图像真实性相关的弗雷歇特初始距离(FID, Fréchet Inception Distance)指标。 该评测基准集当前包含中文与英文两类语言数据:其中OCR评测子集的规模为中英各1000张图像,FID评测子集的规模则为中英各40000张图像。关于评测方法的详细细节与代码实现,请参考[论文](https://arxiv.org/abs/2311.03054)及[代码仓库](https://github.com/tyxsspa/AnyText)。 2025年2月28日更新:本次更新补充了适配AnyText2使用的长描述(long caption)版本评测基准集,相关信息可参考[论文](https://arxiv.org/abs/2411.15245)及[代码仓库](https://github.com/tyxsspa/AnyText2)。 ### 通过HTTP协议克隆 bash git clone https://www.modelscope.cn/datasets/iic/AnyText-benchmark.git
提供机构:
maas
创建时间:
2024-02-20
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
AnyText评测集是由AnyText提供的多语言视觉文本生成和编辑模型的评估数据集,包含中文和英文两种语言的数据,用于评估文本生成方法的性能,包括OCR相关指标和图像真实性相关的FID指标。数据集最近更新增加了AnyText2使用的长标题版本。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作