The Children’s Book Test 问答数据集
收藏阿里云天池2026-06-03 更新2024-03-07 收录
下载链接:
https://tianchi.aliyun.com/dataset/88746
下载链接
链接失效反馈官方服务:
资源简介:
CBT 数据集由文字段落和相应问题构建,问答数据均来自古腾堡项目免费提供的书籍,该数据集用于直接测量语言模型、更广泛的语言环境用于问答和仿真查找。
The CBT Dataset is constructed from text passages and their corresponding questions. All question-answering data are sourced from freely accessible books provided by Project Gutenberg. This dataset is used to directly evaluate language models, and the broader linguistic context it offers supports question answering and simulated retrieval.
提供机构:
阿里云天池
创建时间:
2021-01-20
搜集汇总
数据集介绍

背景与挑战
背景概述
The Children’s Book Test (CBT) 问答数据集基于古腾堡项目的免费儿童书籍构建,包含文字段落和对应问题,用于评估语言模型在问答任务中的性能。该数据集由Facebook于2016年发布,问题按词性类型(如命名实体、普通名词等)分类,涵盖训练、验证和测试集。
以上内容由遇见数据集搜集并总结生成



