five

haritzpuerto/MetaQA_Agents_Predictions

收藏
Hugging Face2022-09-04 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/haritzpuerto/MetaQA_Agents_Predictions
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含了多个问答(QA)代理对多个QA数据集的预测结果。这些代理包括Span-Extraction Agents、Multiple-Choice Agents、Abstractive Agents和Multimodal Agents。数据集的结构包括每个代理的文件夹,文件夹内包含每个数据集的预测文件。数据集的所有QA数据集都使用英语,因此代理的预测结果也是英语。该数据集的目的是帮助开发新的多代理模型,并分析QA模型的预测结果。
提供机构:
haritzpuerto
原始信息汇总

MetaQA Agents Predictions 数据集概述

数据集描述

  • 语言: 英语
  • 许可证: Apache-2.0
  • 多语言性: 单语种
  • 标签: 多代理问答、多代理QA、预测
  • 任务类别: 问答

数据集总结

本数据集包含多个问答代理对各种问答数据集的预测结果。具体包括:

抽取式代理

  • 代理: Span-BERT Large (Joshi et al.,2020),分别在不同的数据集上训练,包括SQuAD、NewsQA、HotpotQA、SearchQA、Natural Questions、TriviaQA-web、QAMR、DuoRC、DROP。

多选题代理

  • 代理: RoBERTa Large (Liu et al., 2019)、AlBERT xxlarge-v2 (Lan et al., 2020)、BERT Large-wwm (Devlin et al., 2019),分别在RACE、Commonsense QA、BoolQ、HellaSWAG、Social IQA上训练。

摘要式代理

  • 代理: TASE (Segal et al., 2020)、BART Large with Adapters (Pfeiffer et al., 2020),分别在DROP和NarrativeQA上训练。

多模态代理

  • 代理: Hybrider (Chen et al., 2020),在HybridQA上训练。

数据集结构

每个代理都有一个文件夹,内部包含每个数据集的四个文件:

  • predict_nbest_predictions.json
  • predict_predictions.json / predictions.json
  • predict_results.json(仅限抽取式代理)

文件结构

  • predict_nbest_predictions.json: 包含每个问题的多个预测答案及其概率。
  • predict_predictions.json: 包含每个问题的最终预测答案。

数据分割

所有问答数据集均包含训练集、验证集和测试集。

使用数据集的注意事项

  • 社会影响: 本数据集旨在帮助开发新的多代理模型并分析问答模型的预测。
  • 偏见讨论: 使用的问答模型可能不完美,可能生成错误数据并包含偏见,发布这些预测有助于识别模型中的缺陷。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作