five

EURLEX57K

收藏
arXiv2025-09-30 收录
下载链接:
https://github.com/iliaschalkidis/lmtc-eurlex57k
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含了用于评估少样本/零样本文档分类方法中的欧盟立法文件。其中,零样本标签在训练集中没有任何实例,而少样本标签则被定义为在训练集中的出现频率小于或等于50的标签。该数据集规模较大,任务是对少样本/零样本设置下的多标签进行分类。

This dataset contains EU legislative documents utilized for evaluating few-shot and zero-shot document classification methods. Specifically, zero-shot labels have no instances in the training set, while few-shot labels are defined as those with a frequency of ≤50 in the training set. This is a large-scale dataset, and the task is multi-label classification under the few-shot and zero-shot settings.
提供机构:
Chalkidis et al.
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作