five

daniilak/russian_captcha_images

收藏
Hugging Face2023-02-24 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/daniilak/russian_captcha_images
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多个CSV文件,每个文件存储了不同来源和类型的验证码图像,这些图像以base64字符串的形式呈现。数据集分为几个部分:fssp_*.csv文件包含了40,310张图片,分为4个类别,每个类别的图片包含不同数量的符号;fms.csv文件包含约15,000张由6个数字组成的验证码图片;rosreestr.csv文件包含约10,000张由5个英文字符和数字组成的验证码图片;vk.csv文件包含约19,000张由5到6个俄文字符和数字组成的验证码图片。此外,数据集是之前在Kaggle上发布的数据集的更新版本。
提供机构:
daniilak
原始信息汇总

数据集概述

数据集内容

  • fssp_*.csv: 包含40,310张图片,分为四个类别:

    • 4个符号:6,747张
    • 5个符号:18,403张
    • 6个符号:7,038张
    • 7个符号:7,589张 使用的符号包括:б,в,г,д,ж,к,л,м,н,п,р,с,т,2,4,5,6,7,8,9
  • fms.csv: 约15,000张包含6个数字的验证码图片。

  • rosreestr.csv: 约10,000张包含5个英文字符和数字的验证码图片。

  • vk.csv: 约19,000张包含5到6个俄文字符和数字的验证码图片,来自社交网络vk.com。

数据集特点

  • 所有CSV文件使用" "作为分隔符。
  • 验证码图片以base64字符串形式呈现。

许可证

数据集遵循公共领域(Public Domain)许可证。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作