CALOR
收藏arXiv2018-12-19 更新2024-08-06 收录
下载链接:
http://arxiv.org/abs/1812.08039v1
下载链接
链接失效反馈官方服务:
资源简介:
CALOR数据集是由奥兰治实验室与艾克斯-马赛大学合作创建的,专注于法语百科历史文本的语义框架标注。该数据集包含1.3百万词,来源于维基百科考古门户、第一次世界大战门户、Vikidia的史前和古代门户以及ClioTexte的第一次世界大战资源。创建过程中,从1.3M词文本中提取了最频繁的100个动词,并筛选出与信息抽取应用框架相关的53个不同框架。CALOR数据集主要用于信息抽取,特别是从百科全文中提取历史信息,旨在通过部分解析而非全文解析,以较低成本获得大量标注数据,支持机器学习方法的发展。
提供机构:
奥兰治实验室与艾克斯-马赛大学
创建时间:
2018-12-19



