relbert/analogy_questions
收藏Hugging Face2023-05-16 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/relbert/analogy_questions
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含5种不同的词汇类比问题,用于类比语言模型的研究。数据集分为原始类比问题和额外类比问题,每种问题都有详细的规模、选择数量和关系组数量。数据实例展示了测试数据的结构,包括查询词对、候选词对和正确答案的索引。数据集的所有资源均遵循CC-BY-NC-4.0许可,可用于学术研究或个人研究,但禁止商业用途。
提供机构:
relbert
原始信息汇总
数据集概述
数据集基本信息
- 名称: Analogy Question
- 语言: 英语
- 许可证: CC-BY-NC-4.0
- 多语言性: 单语种
- 大小: 小于1000条记录
数据集详情
数据集总结
- 内容: 包含5种不同的词汇类比问题,用于类比语言模型。
- 原始类比问题:
- u2: 24/228条记录,9个关系组
- u4: 48/432条记录,5个关系组
- google: 50/500条记录,2个关系组
- bats: 199/1799条记录,3个关系组
- 额外类比问题:
- semeval2012_relational_similarity: 79条记录,79个关系组
- t_rex_relational_similarity: 496/183条记录,60/19个关系组
- conceptnet_relational_similarity: 1112/1192条记录,18/16个关系组
- nell_relational_similarity: 400/600条记录,4/6个关系组
- scan: 178/1616条记录,2/2个关系组
数据集结构
- 数据实例:
- 示例: 包含
stem(查询词对),choice(词对候选),answer(正确候选的索引)。 - 格式: 所有数据除Google数据集外均为小写。
- 示例: 包含
引用信息
@inproceedings{ushio-etal-2021-bert-is, title ={{BERT} is to {NLP} what {A}lex{N}et is to {CV}: {C}an {P}re-{T}rained {L}anguage {M}odels {I}dentify {A}nalogies?}, author={Ushio, Asahi and Espinosa-Anke, Luis and Schockaert, Steven and Camacho-Collados, Jose}, booktitle={Proceedings of the {ACL}-{IJCNLP} 2021 Main Conference}, year={2021}, publisher={Association for Computational Linguistics} }



