five

allenai/zest

收藏
Hugging Face2024-01-18 更新2024-05-25 收录
下载链接:
https://hf-mirror.com/datasets/allenai/zest
下载链接
链接失效反馈
官方服务:
资源简介:
ZEST数据集旨在测试NLP系统是否能够在零样本学习的情况下执行未见过的任务,仅通过任务的自然语言描述。数据集包含分类、类型实体提取和关系提取等任务,每个任务配有20个不同的标注(输入,输出)示例。数据集的结构允许系统地测试模型是否能够在五种不同的方式下进行泛化。数据集为英文,由Mechanical Turk的众包工人创建和标注,采用CC BY 4.0许可证。
提供机构:
allenai
原始信息汇总

数据集概述

名称: ZEST

描述: ZEST 是一个用于测试 NLP 系统在零样本学习场景下,能否根据自然语言描述执行未见任务的数据集。它体现了“从任务描述中学习”的框架,包含分类、实体类型提取和关系提取等任务,每个任务配有 20 个不同的标注(输入,输出)示例。

语言: 英语

许可证: CC-BY-4.0

多语言性: 单语种

大小: 10K<n<100K

源数据: 原始数据

任务类别:

  • 问答
  • 令牌分类

任务ID:

  • closed-domain-qa
  • extractive-qa

数据集信息:

特征

  • task_id: 字符串
  • question: 字符串
  • generalization_type: 字符串
  • derives_from: 序列,字符串
  • domain: 字符串
  • context: 字符串
  • answer: 序列,字符串
  • all_answers: 序列,字符串

数据分割

  • 训练集: 10766 个样本,9588987 字节
  • 验证集: 2280 个样本,2056804 字节
  • 测试集: 11980 个样本,9280845 字节

下载大小: 5796188 字节

数据集大小: 20926636 字节

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作