five

appier-ai-research/StreamBench

收藏
Hugging Face2024-08-14 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/appier-ai-research/StreamBench
下载链接
链接失效反馈
官方服务:
资源简介:
该README文件描述了多个数据集的结构和配置信息,包括每个数据集的名称、特征、分割、下载大小和数据集大小等。每个数据集的特征字段详细列出了其包含的数据类型和结构。此外,README还提供了引用StreamBench论文的链接和引用格式。

The README file describes the structure and configuration information of multiple datasets, including the name, features, splits, download size, and dataset size of each dataset. The feature fields of each dataset detail the data types and structures they contain. Additionally, the README provides a link to the StreamBench paper and the citation format.
提供机构:
appier-ai-research
原始信息汇总

数据集概述

数据集配置

bird

  • 特征:
    • db_id: 字符串
    • question: 字符串
    • evidence: 字符串
    • SQL: 字符串
    • question_id: 整数
    • difficulty: 字符串
  • 分割:
    • train: 2601311 字节, 6599 样本
    • validation: 2601311 字节, 6599 样本
    • test: 586056 字节, 1534 样本
  • 下载大小: 2733604 字节
  • 数据集大小: 5788678 字节

cosql

  • 特征:
    • question: 字符串
    • SQL: 字符串
    • db_id: 字符串
    • order: 整数
    • evidence: 字符串
    • difficulty: 字符串
    • question_id: 字符串
  • 分割:
    • validation: 382980 字节, 1155 样本
    • test: 334388 字节, 1007 样本
    • train: 900616 字节, 2688 样本
  • 下载大小: 643057 字节
  • 数据集大小: 1617984 字节

ddxplus

  • 特征:
    • AGE: 整数
    • SEX: 字符串
    • INITIAL_EVIDENCE_ENG: 字符串
    • EVIDENCES_ENG: 字符串
    • PATIENT_PROFILE: 字符串
    • DIFFERENTIAL_DIAGNOSIS: 字符串
    • PATHOLOGY: 字符串
    • INITIAL_EVIDENCE: 字符串
    • EVIDENCES: 字符串
  • 分割:
    • validate: 2597447 字节, 1372 样本
    • test: 3318154 字节, 1764 样本
  • 下载大小: 1085173 字节
  • 数据集大小: 5915601 字节

ds_1000

  • 特征:
    • prompt: 字符串
    • reference_code: 字符串
    • metadata: 结构体
      • problem_id: 整数
      • library_problem_id: 整数
      • library: 字符串
      • test_case_cnt: 整数
      • perturbation_type: 字符串
      • perturbation_origin_id: 整数
    • code_context: 字符串
  • 分割:
    • test: 3143238 字节, 1000 样本
  • 下载大小: 717348 字节
  • 数据集大小: 3143238 字节

hotpotqa_distract

  • 特征:
    • id: 字符串
    • question: 字符串
    • answer: 字符串
    • type: 字符串
    • level: 字符串
    • supporting_facts: 序列
      • title: 字符串
      • sent_id: 整数
    • context: 序列
      • title: 字符串
      • sentences: 序列字符串
  • 分割:
    • test: 9249740 字节, 1500 样本
  • 下载大小: 5567865 字节
  • 数据集大小: 9249740 字节

spider

  • 特征:
    • question: 字符串
    • SQL: 字符串
    • db_id: 字符串
    • question_id: 整数
    • evidence: 字符串
    • difficulty: 字符串
  • 分割:
    • validation: 344953 字节, 1034 样本
    • test: 757143 字节, 2147 样本
    • train: 1438451 字节, 4001 样本
  • 下载大小: 763618 字节
  • 数据集大小: 2540547 字节

toolbench

  • 特征:
    • query: 字符串
    • api_name: 字符串
    • api_desc: 字符串
    • api_input: 字符串
  • 分割:
    • test: 509646 字节, 750 样本
  • 下载大小: 44499 字节
  • 数据集大小: 509646 字节
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作