Cross-Dataset
收藏arXiv2025-09-30 收录
下载链接:
https://github.com/AtmaHou/FewShotTagging
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含了来自不同领域的四个子集:新闻(CoNLL-2003)、维基(GUM)、社交媒体(WNUT-2017)和混合数据(Ontonotes),这些子集用于构建少样本命名实体识别(NER)的训练场景。各子集在训练、验证和测试方面相互独立,互不重叠。在5次射击设置中,该数据集规模为200个训练场景、100个验证场景和100个测试场景。所面临的任务是少样本命名实体识别。



