masakhaner
收藏Opencsg2024-07-19 更新2025-05-03 收录
下载链接:
https://www.opencsg.com/datasets/AIWizards/masakhaner
下载链接
链接失效反馈官方服务:
资源简介:
MasakhaNER专注于为十种非洲语言提供命名实体识别服务,这些语言包括阿姆哈拉语、豪萨语、伊博语、卢旺达语、卢干达语、卢奥语、尼日利亚皮钦语、斯瓦希里语、沃洛夫语和约鲁巴语。它提供专家生成的标注信息,包含PER(人名)、ORG(组织机构)、LOC(地点)和DATE(日期)四种实体类型,并采用BIO标注格式。数据来源于新闻领域,规模适中,每种语言均包含训练集、验证集和测试集。该数据集遵循CC 4.0非商业许可协议。
创建时间:
2024-07-19



