five

relbert/analogy_questions

收藏
Hugging Face2023-05-16 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/relbert/analogy_questions
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含5种不同的词汇类比问题,用于类比语言模型的研究。数据集分为原始类比问题和额外类比问题,每种问题都有详细的规模、选择数量和关系组数量。数据实例展示了测试数据的结构,包括查询词对、候选词对和正确答案的索引。数据集的所有资源均遵循CC-BY-NC-4.0许可,可用于学术研究或个人研究,但禁止商业用途。
提供机构:
relbert
原始信息汇总

数据集概述

数据集基本信息

  • 名称: Analogy Question
  • 语言: 英语
  • 许可证: CC-BY-NC-4.0
  • 多语言性: 单语种
  • 大小: 小于1000条记录

数据集详情

数据集总结

  • 内容: 包含5种不同的词汇类比问题,用于类比语言模型
  • 原始类比问题:
    • u2: 24/228条记录,9个关系组
    • u4: 48/432条记录,5个关系组
    • google: 50/500条记录,2个关系组
    • bats: 199/1799条记录,3个关系组
  • 额外类比问题:
    • semeval2012_relational_similarity: 79条记录,79个关系组
    • t_rex_relational_similarity: 496/183条记录,60/19个关系组
    • conceptnet_relational_similarity: 1112/1192条记录,18/16个关系组
    • nell_relational_similarity: 400/600条记录,4/6个关系组
    • scan: 178/1616条记录,2/2个关系组

数据集结构

  • 数据实例:
    • 示例: 包含stem(查询词对),choice(词对候选),answer(正确候选的索引)。
    • 格式: 所有数据除Google数据集外均为小写。

引用信息

@inproceedings{ushio-etal-2021-bert-is, title ={{BERT} is to {NLP} what {A}lex{N}et is to {CV}: {C}an {P}re-{T}rained {L}anguage {M}odels {I}dentify {A}nalogies?}, author={Ushio, Asahi and Espinosa-Anke, Luis and Schockaert, Steven and Camacho-Collados, Jose}, booktitle={Proceedings of the {ACL}-{IJCNLP} 2021 Main Conference}, year={2021}, publisher={Association for Computational Linguistics} }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作