FIGER (Fine-Grained Entity Recognition)
收藏OpenDataLab2026-05-24 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/FIGER
下载链接
链接失效反馈官方服务:
资源简介:
FIGER 数据集是一个实体识别数据集,其中使用细粒度系统 112 标签标记实体,例如人/医生、艺术/书面工作和建筑/酒店。标签派生自 Freebase 类型。训练集由使用锚链接中编码的信息的远程监督方法自动注释的维基百科文章组成。测试集是手动注释的。
The FIGER dataset is an entity recognition dataset that uses a fine-grained 112-label taxonomy to tag entities, such as person/doctor, art/written work, and architecture/hotel. The labels are derived from Freebase types. The training set consists of Wikipedia articles automatically annotated via distant supervision methods that utilize information encoded in anchor links. The test set is manually annotated.
提供机构:
OpenDataLab
创建时间:
2022-05-23
搜集汇总
数据集介绍

背景与挑战
背景概述
FIGER数据集是一个细粒度实体识别数据集,使用112个标签对实体进行标注,如人/医生、艺术/书面工作等。训练集通过远程监督方法自动标注维基百科文章,测试集则为手动标注,适用于实体识别相关研究。
以上内容由遇见数据集搜集并总结生成



