SteffRhes/APIS_OEBL__Named_Entity_Recognition
收藏Hugging Face2024-06-04 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/SteffRhes/APIS_OEBL__Named_Entity_Recognition
下载链接
链接失效反馈官方服务:
资源简介:
APIS ÖBL命名实体识别数据集包含6,941个历史传记句子,标注了PER(人物)、ORG(组织)和LOC(地点)等命名实体。数据来源于奥地利传记词典(ÖBL),并在奥地利人物信息系统(APIS)项目的背景下提取和标注。文本涉及19世纪至20世纪初奥匈帝国时期的小型传记,由奥地利科学院在1957年至2023年间制作。数据以JSON格式存储,包含原始文本和实体索引及类型。数据集未预先分割为训练、开发和评估集,也未进行预分词处理。
提供机构:
SteffRhes
原始信息汇总
数据集概述
基本信息
- 名称: APIS ÖBL Named Entity Recognition
- 语言: 德语
- 许可: MIT
- 任务类别: 词分类
数据内容
- 数据量: 包含6,941个句子
- 标注类型: "PER"(人物)、"ORG"(组织)、"LOC"(地点)
- 来源: 从奥地利传记词典(ÖBL)中提取,作为奥地利人物信息系统(APIS)项目的一部分。
- 时间范围: 19世纪至20世纪初
- 制作机构: 奥地利科学院
- 语言风格: 较为浓缩,包含大量领域特定缩写
数据结构
- JSON结构: 包含键
text_raw的文本和键entities的实体索引及类型 - 句子处理: 原始数据被分割成句子并随机标注
- 数据分割: 未预先分割为训练集、开发集和评估集
- 分词处理: 未预先分词



