pioNER
收藏arXiv2018-10-20 更新2024-06-21 收录
下载链接:
https://github.com/ispras-texterra/pioner
下载链接
链接失效反馈官方服务:
资源简介:
pioNER是一个针对亚美尼亚语的命名实体识别数据集,由俄罗斯-亚美尼亚大学Ivannikov系统编程实验室创建。该数据集包含163,000个自动标注的维基百科令牌和53,400个人工标注的新闻句子令牌,用于训练和评估命名实体识别模型。数据集的创建过程中,利用了维基百科文章间的链接进行自动标注,并手动标注了新闻来源的命名实体。该数据集主要用于解决亚美尼亚语命名实体识别的挑战,支持机器学习和自然语言处理领域的研究。
提供机构:
俄罗斯-亚美尼亚大学Ivannikov系统编程实验室
创建时间:
2018-10-20



