BIG-Bench Instruction Induction

arXiv2025-09-30 收录

下载链接：

https://github.com/keirp/automatic_prompt_engineer/tree/main/data/bigbench-ii

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集旨在评估跨多种任务的教学引导能力，包括认知推理、逻辑谬误检测、暗示、倒装句、因果判断以及Winowhy等任务。为了提示生成和评估的目的，该数据集被划分为训练集（60%）、验证集（20%）和测试集（20%）。该数据集覆盖了多种任务，并具有较大的数据量，其核心任务是跨多种任务的教学引导。

5,000+

优质数据集

54 个

任务类型

进入经典数据集