five

Handwriting Recognition|手写识别数据集|机器学习数据集

收藏
阿里云天池2025-09-26 更新2024-03-07 收录
手写识别
机器学习
下载链接:
https://tianchi.aliyun.com/dataset/94124
下载链接
链接失效反馈
资源简介:
该数据集包含通过慈善项目收集的超过40万个手写姓名。字符识别利用图像处理技术将扫描文档上的字符转换为数字形式。它通常在机器打印的字体中表现良好。然而,由于个人书写风格的巨大差异,对于机器识别手写字符仍然提出了艰巨的挑战。总共有206,799个姓氏和207,024个姓氏。数据分别分为训练集(331,059),测试集(41,382)和验证集(41,382)。
提供机构:
阿里云天池
创建时间:
2021-03-12
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

CHARLS

中国健康与养老追踪调查(CHARLS)数据集,旨在收集反映中国45岁及以上中老年人家庭和个人的高质量微观数据,用以分析人口老龄化问题,内容包括健康状况、经济状况、家庭结构和社会支持等。

charls.pku.edu.cn 收录

Google Scholar

Google Scholar是一个学术搜索引擎,旨在检索学术文献、论文、书籍、摘要和文章等。它涵盖了广泛的学科领域,包括自然科学、社会科学、艺术和人文学科。用户可以通过关键词搜索、作者姓名、出版物名称等方式查找相关学术资源。

scholar.google.com 收录

MeSH

MeSH(医学主题词表)是一个用于索引和检索生物医学文献的标准化词汇表。它包含了大量的医学术语和概念,用于描述医学文献中的主题和内容。MeSH数据集包括主题词、副主题词、树状结构、历史记录等信息,广泛应用于医学文献的分类和检索。

www.nlm.nih.gov 收录

Plant-Diseases

Dataset for Plant Diseases containg variours Plant Disease

kaggle 收录

alpacaGPT4_llama8b-v120-jb-seed2-alpaca_512_ngt0.7_tp0.9

该数据集包含了用户和助手之间的对话,具有用户和助手发言的文本特征,以及一个索引级别特征。数据集分为训练集,共有52001条对话记录。

huggingface 收录