five

SteffRhes/APIS_OEBL__Named_Entity_Recognition

收藏
Hugging Face2024-06-04 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/SteffRhes/APIS_OEBL__Named_Entity_Recognition
下载链接
链接失效反馈
官方服务:
资源简介:
APIS ÖBL命名实体识别数据集包含6,941个历史传记句子,标注了PER(人物)、ORG(组织)和LOC(地点)等命名实体。数据来源于奥地利传记词典(ÖBL),并在奥地利人物信息系统(APIS)项目的背景下提取和标注。文本涉及19世纪至20世纪初奥匈帝国时期的小型传记,由奥地利科学院在1957年至2023年间制作。数据以JSON格式存储,包含原始文本和实体索引及类型。数据集未预先分割为训练、开发和评估集,也未进行预分词处理。
提供机构:
SteffRhes
原始信息汇总

数据集概述

基本信息

  • 名称: APIS ÖBL Named Entity Recognition
  • 语言: 德语
  • 许可: MIT
  • 任务类别: 词分类

数据内容

数据结构

  • JSON结构: 包含键text_raw的文本和键entities的实体索引及类型
  • 句子处理: 原始数据被分割成句子并随机标注
  • 数据分割: 未预先分割为训练集、开发集和评估集
  • 分词处理: 未预先分词
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作