ClozeT
收藏OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/ClozeT
下载链接
链接失效反馈官方服务:
资源简介:
ClozeT数据集是手动标记的中文故事完形填空数据集。相应的任务是: 给定一个故事,有一个缺少的句子和两个选项,每个选项都是一个句子,选择其中一个选项,以便可以填写。融入故事,形成合理的逻辑情节。故事数据集来源于从网络上抓取的儿童故事。在构造选项时,从故事中提取一个可以从上下文和常识推导出的句子作为正确选项,并请众包注释者将其改写成违反常识的句子作为错误选项。本任务主要考察模型在长文本上的常识性推理能力。
提供机构:
OpenDataLab
创建时间:
2023-05-15
搜集汇总
数据集介绍

背景与挑战
背景概述
ClozeT是一个手动标注的中文故事完形填空数据集,旨在评估模型在长文本中的常识推理能力。该数据集基于网络儿童故事构建,通过提取合理句子作为正确选项,并改写为违反常识的句子作为错误选项,要求模型选择能逻辑融入故事的句子。
以上内容由遇见数据集搜集并总结生成



