five

KIND (Kessler Italian Named-entities Dataset)

收藏
OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/KIND
下载链接
链接失效反馈
官方服务:
资源简介:
KIND 是用于命名实体识别的意大利数据集。它包含超过一百万个标记,其注释涵盖三个类别:人员、位置和组织。大部分数据集(大约 600K 代币)包含三个不同领域的人工黄金注释:新闻、文学和政治话语。对于数据集的构建,我们决定使用公开可用的文本,并获得允许研究和商业的许可使用。特别是我们发布了四个章节,其中的文本来自: (i) Wikinews (WN) 作为过去几十年的新闻文本的来源; (ii) 一些公共领域的意大利小说书籍 (FIC); (iii) 意大利政治家 Aldo Moro (AM) 和 (iv) Alcide De Gasperi (ADG) 的著作和演讲。
提供机构:
OpenDataLab
创建时间:
2022-06-23
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作