five

usmiva/bg_ner_bsnlp

收藏
Hugging Face2023-06-27 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/usmiva/bg_ner_bsnlp
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集最初是为2019年BSNLP共享任务创建的,并在相关会议论文中进行了报告。随后,数据集在另一篇论文中得到了改进,并最终转换为适合Huggingface的CSV格式。数据集的结构包括训练和测试分割,但未提供关于数据实例、数据字段、注释过程等详细信息。

该数据集最初是为2019年BSNLP共享任务创建的,并在相关会议论文中进行了报告。随后,数据集在另一篇论文中得到了改进,并最终转换为适合Huggingface的CSV格式。数据集的结构包括训练和测试分割,但未提供关于数据实例、数据字段、注释过程等详细信息。
提供机构:
usmiva
原始信息汇总

数据集概述

数据集名称

  • 名称: Bulgarian Named Entity Recognition

数据集来源

  • 初始来源: Balto-Slavic NLP shared task
  • 改进研究: "Reconstructing NER Corpora: a Case Study on Bulgarian"

数据集用途

  • 用途: 用于token classification

数据集版本

  • 版本: 数据集已随机化并分为训练集和测试集

数据集语言

  • 语言: Bulgarian (bg)

数据集许可证

  • 许可证: Apache-2.0

数据集创建

  • 创建背景: 用于BSNLP Shared Task 2019
  • 改进与转换: 转换为适合Huggingface的csv格式

引用信息

  • 引用文献1: Piskorski, Jakub et al. "The Second Cross-Lingual Challenge on Recognition, Normalization, Classification, and Linking of Named Entities across Slavic Languages". Proceedings of the 7th Workshop on Balto-Slavic Natural Language Processing, 2019.
  • 引用文献2: Marinova, Iva et al. "Reconstructing NER Corpora: a Case Study on Bulgarian". Proceedings of the Twelfth Language Resources and Evaluation Conference, 2020.
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作