five

LEPISZCZE

收藏
arXiv2022-11-24 更新2024-08-06 收录
下载链接:
http://arxiv.org/abs/2211.13112v1
下载链接
链接失效反馈
官方服务:
资源简介:
LEPISZCZE是一个专为波兰语设计的综合性NLP基准数据集,由弗罗茨瓦夫理工大学创建。该数据集包含13个实验,涉及多种任务和高质量的操作化基准。LEPISZCZE旨在通过提供灵活的框架,支持简单地添加新模型、数据集和任务,同时确保数据版本控制和模型跟踪,从而推动波兰语NLP领域的发展。数据集的应用领域广泛,旨在解决语言模型训练中的真实进展评估问题,特别是在资源较少的语言环境中。

LEPISZCZE is a comprehensive NLP benchmark dataset specifically designed for the Polish language, developed by Wrocław University of Science and Technology. It includes 13 experiments covering a variety of tasks and high-quality operational benchmarks. LEPISZCZE aims to advance the Polish NLP field by providing a flexible framework that enables straightforward addition of new models, datasets and tasks, while ensuring data version control and model tracking. The dataset has broad application scenarios, and is designed to address the issue of authentic progress evaluation in language model training, especially in low-resource language settings.
提供机构:
弗罗茨瓦夫理工大学
创建时间:
2022-11-24
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作