EVOUNA
收藏arXiv2025-09-30 收录
下载链接:
https://github.com/wangcunxiang/QA-Eval
下载链接
链接失效反馈官方服务:
资源简介:
该数据集旨在评估人工智能生成的答案在开放问答领域中与标准答案的准确性。它包含了经过筛选的实例以提升准确度,并且作者亲自进行了人工标注过程,确保了数据质量。在规模上,该数据集包括NQ类别下的3610个案例和TQ类别下的500个案例。其任务是进行问答评估(Qa-Eval)的评价。
提供机构:
Authors of the paper



