daniilak/russian_captcha_images
收藏Hugging Face2023-02-24 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/daniilak/russian_captcha_images
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个CSV文件,每个文件存储了不同来源和类型的验证码图像,这些图像以base64字符串的形式呈现。数据集分为几个部分:fssp_*.csv文件包含了40,310张图片,分为4个类别,每个类别的图片包含不同数量的符号;fms.csv文件包含约15,000张由6个数字组成的验证码图片;rosreestr.csv文件包含约10,000张由5个英文字符和数字组成的验证码图片;vk.csv文件包含约19,000张由5到6个俄文字符和数字组成的验证码图片。此外,数据集是之前在Kaggle上发布的数据集的更新版本。
提供机构:
daniilak
原始信息汇总
数据集概述
数据集内容
-
fssp_*.csv: 包含40,310张图片,分为四个类别:
- 4个符号:6,747张
- 5个符号:18,403张
- 6个符号:7,038张
- 7个符号:7,589张 使用的符号包括:б,в,г,д,ж,к,л,м,н,п,р,с,т,2,4,5,6,7,8,9
-
fms.csv: 约15,000张包含6个数字的验证码图片。
-
rosreestr.csv: 约10,000张包含5个英文字符和数字的验证码图片。
-
vk.csv: 约19,000张包含5到6个俄文字符和数字的验证码图片,来自社交网络vk.com。
数据集特点
- 所有CSV文件使用" "作为分隔符。
- 验证码图片以base64字符串形式呈现。
许可证
数据集遵循公共领域(Public Domain)许可证。



