five

lang-uk/hypernymy_pairs

收藏
Hugging Face2023-05-11 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/lang-uk/hypernymy_pairs
下载链接
链接失效反馈
官方服务:
资源简介:
乌克兰语超义词对数据集是一个包含乌克兰语中超义词关系的名词对集合。数据集包含四种不同类型的超义词关系对:超义词-下义词、同下义词、超义词-实例和同实例。这些数据通过WordNet、Wikidata和乌克兰维基百科构建,所有术语均为维基百科文章标题,未进行预处理。数据集可用于超义词检测任务,帮助模型判断两个词是否处于超义词关系。

乌克兰语超义词对数据集是一个包含乌克兰语中超义词关系的名词对集合。数据集包含四种不同类型的超义词关系对:超义词-下义词、同下义词、超义词-实例和同实例。这些数据通过WordNet、Wikidata和乌克兰维基百科构建,所有术语均为维基百科文章标题,未进行预处理。数据集可用于超义词检测任务,帮助模型判断两个词是否处于超义词关系。
提供机构:
lang-uk
原始信息汇总

Ukrainian Hypernymy Pairs Dataset

数据集描述

  • 语言: 乌克兰语
  • 大小: 100,000 < n < 1,000,000
  • 任务类别: 问答、总结

数据集内容

  • 关系类型: 包含四种关系类型:
    • 超类-子类 (Hypernym-Hyponym)
    • 共子类 (Co-Hyponyms)
    • 超类-实例 (Hypernym-Instance)
    • 共实例 (Co-Instances)
  • 构建方法: 利用Princeton WordNet、Wikidata和乌克兰Wikipedia之间的链接,使用Python的Wn包获取关系。
  • 数据预处理: 未进行预处理,所有术语为维基百科文章标题,可能包含括号内的额外信息。

数据集统计

关系类型 # of Pairs
Hypernym-Hyponym 6,906
Co-Hyponyms 42,860
Hypernym-Instance 2,971
Co-Instances 22,927
Total # of Pairs 275,664

预期用途

  • 主要用途: 用于超类检测任务,模型需判断给定的词对是否存在超类关系。
  • 扩展用途: 可添加其他词汇语义关系以增加数据集的多样性。

版权信息

  • 版权所有者: Nataliia Romanyshyn, Dmytro Chaplynskyi, lang-uk project
  • 版权年份: 2023
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作