five

FoNDUE-HTR: Data and models for the FoNDUE project

收藏
SSH Open MarketPlace2025-08-18 更新2025-08-23 收录
下载链接:
https://marketplace.sshopencloud.eu/dataset/IBlbx4
下载链接
链接失效反馈
官方服务:
资源简介:
Ce dossier contient de nombreux sets de données et models utilises pour le ’HTR (​Handwritten Text Recognition​), parfois aussi appelé OCR (​Optical character recognition​). L’HTR permet d'extraire rapidement et efficacement un maximum d’informations d’une page numérisée, dont évidemment la transcription mais pas uniquement (illustrations, mise en page...), et reproduire cette opération sur des grandes quantités de documents. L'obtention de ces données, désormais cruciales pour concevoir les grands corpus nécessaires à la recherche en lettres, implique des besoins informatiques nouveaux et très importants. Concernant la partie logiciel, le choix des équipes de l'UNIGE s’est porté sur ​eScriptorium [lien], une application en ligne proposant une solution intégralement ​open source​, déjà mature d’un point de vue technique (plusieurs années de développement) et bénéficiant de soutiens internationaux (France, USA, Allemagne…) qui en garantissent la fiabilité et l'efficacité. Data & models related to FonDUE-HTR

本数据集文件夹包含众多用于手写文本识别(Handwritten Text Recognition,简称HTR,有时也称作光学字符识别(Optical Character Recognition,简称OCR))的数据集与模型。 手写文本识别(HTR)可快速高效地从数字化页面中提取海量信息——不仅可完成文本转录,还可涵盖插图、页面布局等其他内容,并可将该流程推广至大批量文档处理。如今,这类数据是构建人文科学研究所需大型语料库的核心要素,其获取过程催生了全新且规模庞大的算力需求。在软件选型方面,日内瓦大学(UNIGE)团队选用了eScriptorium在线应用:这是一套完全开源的成熟解决方案,历经多年技术开发,技术层面已相当成熟,并获得法国、美国、德国等多国国际支持,由此保障了其可靠性与高效性。 FonDUE-HTR相关数据集与模型
创建时间:
2025-08-18
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作