five

sunilsah-447349/Hansel

收藏
Hugging Face2025-12-12 更新2025-12-20 收录
下载链接:
https://hf-mirror.com/datasets/sunilsah-447349/Hansel
下载链接
链接失效反馈
官方服务:
资源简介:
Hansel是一个高质量的人工标注中文实体链接(EL)数据集,专注于尾部实体和新兴实体。测试集包含Few-shot(FS)和zero-shot(ZS)切片,有10K个示例,并使用Wikidata作为相应的知识库。训练和验证集来自Wikipedia超链接,可用于中文EL系统的大规模预训练。

Hansel is a high-quality human-annotated Chinese entity linking (EL) dataset, focusing on tail entities and emerging entities: The test set contains Few-shot (FS) and zero-shot (ZS) slices, has 10K examples and uses Wikidata as the corresponding knowledge base. The training and validation sets are from Wikipedia hyperlinks, useful for large-scale pretraining of Chinese EL systems.
提供机构:
sunilsah-447349
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作