five

mocha

收藏
Opencsg2024-07-19 更新2025-05-03 收录
下载链接:
https://www.opencsg.com/datasets/AIWizards/mocha
下载链接
链接失效反馈
官方服务:
资源简介:
MOCHA旨在提供一个用于训练和评估生成式阅读理解指标的基准。它包含从6个不同的问答数据集中提取的4万个人工判断分数,以及用于评估的额外最小对。数据内容包括文章段落、问题、参考答案以及模型生成的候选答案,并附带人工评分。MOCHA支持训练用于阅读理解的评估指标,并提供训练、验证、测试和最小对等数据集划分。该数据集采用CC BY-SA 4.0授权许可。

MOCHA is a benchmark designed for training and evaluating generative reading comprehension metrics. It comprises 40,000 human-annotated scores extracted from six distinct question answering datasets, alongside additional minimal pairs for evaluation purposes. The dataset includes article passages, questions, reference answers, model-generated candidate answers, paired with corresponding human-rated scores. MOCHA supports the training of reading comprehension evaluation metrics, and provides dataset splits for training, validation, test, and minimal pair subsets. This dataset is licensed under CC BY-SA 4.0.
创建时间:
2024-07-19
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作