five

zli12321/pedants_qa_evaluation_bench

收藏
Hugging Face2024-12-16 更新2024-12-21 收录
下载链接:
https://hf-mirror.com/datasets/zli12321/pedants_qa_evaluation_bench
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集用于评估多个问答任务(如Jeopardy、hotpotQA、nq-open、narrativeQA和BIOMRC等)中的候选答案。它包含问题、参考答案(正确答案)、模型生成的候选答案以及人类对候选答案是否正确的判断。数据集的列信息包括问题、参考答案、候选答案、标签、模型、数据集来源和问题上下文。

This dataset evaluates candidate answers for various question-answering (QA) tasks across multiple datasets such as Jeopardy!, hotpotQA, nq-open, narrativeQA, and BIOMRC, etc. It contains questions, reference answers (ground truth), model-generated candidate answers, and human judgments indicating whether the candidate answers are correct.
提供机构:
zli12321
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作