usmiva/bg_ner_bsnlp
收藏Hugging Face2023-06-27 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/usmiva/bg_ner_bsnlp
下载链接
链接失效反馈官方服务:
资源简介:
该数据集最初是为2019年BSNLP共享任务创建的,并在相关会议论文中进行了报告。随后,数据集在另一篇论文中得到了改进,并最终转换为适合Huggingface的CSV格式。数据集的结构包括训练和测试分割,但未提供关于数据实例、数据字段、注释过程等详细信息。
该数据集最初是为2019年BSNLP共享任务创建的,并在相关会议论文中进行了报告。随后,数据集在另一篇论文中得到了改进,并最终转换为适合Huggingface的CSV格式。数据集的结构包括训练和测试分割,但未提供关于数据实例、数据字段、注释过程等详细信息。
提供机构:
usmiva
原始信息汇总
数据集概述
数据集名称
- 名称: Bulgarian Named Entity Recognition
数据集来源
- 初始来源: Balto-Slavic NLP shared task
- 改进研究: "Reconstructing NER Corpora: a Case Study on Bulgarian"
数据集用途
- 用途: 用于token classification
数据集版本
- 版本: 数据集已随机化并分为训练集和测试集
数据集语言
- 语言: Bulgarian (bg)
数据集许可证
- 许可证: Apache-2.0
数据集创建
- 创建背景: 用于BSNLP Shared Task 2019
- 改进与转换: 转换为适合Huggingface的csv格式
引用信息
- 引用文献1: Piskorski, Jakub et al. "The Second Cross-Lingual Challenge on Recognition, Normalization, Classification, and Linking of Named Entities across Slavic Languages". Proceedings of the 7th Workshop on Balto-Slavic Natural Language Processing, 2019.
- 引用文献2: Marinova, Iva et al. "Reconstructing NER Corpora: a Case Study on Bulgarian". Proceedings of the Twelfth Language Resources and Evaluation Conference, 2020.



