lang-uk/hypernymy_pairs
收藏Hugging Face2023-05-11 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/lang-uk/hypernymy_pairs
下载链接
链接失效反馈官方服务:
资源简介:
乌克兰语超义词对数据集是一个包含乌克兰语中超义词关系的名词对集合。数据集包含四种不同类型的超义词关系对:超义词-下义词、同下义词、超义词-实例和同实例。这些数据通过WordNet、Wikidata和乌克兰维基百科构建,所有术语均为维基百科文章标题,未进行预处理。数据集可用于超义词检测任务,帮助模型判断两个词是否处于超义词关系。
乌克兰语超义词对数据集是一个包含乌克兰语中超义词关系的名词对集合。数据集包含四种不同类型的超义词关系对:超义词-下义词、同下义词、超义词-实例和同实例。这些数据通过WordNet、Wikidata和乌克兰维基百科构建,所有术语均为维基百科文章标题,未进行预处理。数据集可用于超义词检测任务,帮助模型判断两个词是否处于超义词关系。
提供机构:
lang-uk
原始信息汇总
Ukrainian Hypernymy Pairs Dataset
数据集描述
- 语言: 乌克兰语
- 大小: 100,000 < n < 1,000,000
- 任务类别: 问答、总结
数据集内容
- 关系类型: 包含四种关系类型:
- 超类-子类 (Hypernym-Hyponym)
- 共子类 (Co-Hyponyms)
- 超类-实例 (Hypernym-Instance)
- 共实例 (Co-Instances)
- 构建方法: 利用Princeton WordNet、Wikidata和乌克兰Wikipedia之间的链接,使用Python的Wn包获取关系。
- 数据预处理: 未进行预处理,所有术语为维基百科文章标题,可能包含括号内的额外信息。
数据集统计
| 关系类型 | # of Pairs |
|---|---|
| Hypernym-Hyponym | 6,906 |
| Co-Hyponyms | 42,860 |
| Hypernym-Instance | 2,971 |
| Co-Instances | 22,927 |
| Total # of Pairs | 275,664 |
预期用途
- 主要用途: 用于超类检测任务,模型需判断给定的词对是否存在超类关系。
- 扩展用途: 可添加其他词汇语义关系以增加数据集的多样性。
版权信息
- 版权所有者: Nataliia Romanyshyn, Dmytro Chaplynskyi, lang-uk project
- 版权年份: 2023



