five

Xnhyacinth/NQ-Image

收藏
Hugging Face2023-11-22 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Xnhyacinth/NQ-Image
下载链接
链接失效反馈
官方服务:
资源简介:
--- license: mit dataset_info: - config_name: ctxs1 features: - name: id dtype: int64 - name: answers sequence: string - name: question dtype: string - name: compressed_prompt struct: - name: compressed_prompt dtype: string - name: compressed_tokens dtype: int64 - name: origin_tokens dtype: int64 - name: ratio dtype: string - name: saving dtype: string - name: ctxs list: - name: id dtype: string - name: text dtype: string - name: title dtype: string splits: - name: train num_bytes: 5212377086 num_examples: 79168 - name: eval num_bytes: 576466670 num_examples: 8757 - name: test num_bytes: 238448436 num_examples: 3610 download_size: 3334114023 dataset_size: 6027292192 - config_name: ctxs100 features: - name: question dtype: string - name: compressed_prompt struct: - name: compressed_prompt dtype: string - name: compressed_tokens dtype: int64 - name: origin_tokens dtype: int64 - name: ratio dtype: string - name: saving dtype: string - name: answers sequence: string - name: id dtype: int64 - name: ctxs list: - name: id dtype: string - name: text dtype: string - name: title dtype: string splits: - name: train num_bytes: 5316136683 num_examples: 79168 - name: eval num_bytes: 587931406 num_examples: 8757 - name: test num_bytes: 243224578 num_examples: 3610 download_size: 3413758169 dataset_size: 6147292667 - config_name: ctxs5 features: - name: id dtype: int64 - name: answers sequence: string - name: question dtype: string - name: compressed_prompt struct: - name: compressed_prompt dtype: string - name: compressed_tokens dtype: int64 - name: origin_tokens dtype: int64 - name: ratio dtype: string - name: saving dtype: string - name: ctxs list: - name: id dtype: string - name: score dtype: float64 - name: text dtype: string - name: title dtype: string splits: - name: train num_bytes: 5379479786 num_examples: 79168 - name: eval num_bytes: 594986589 num_examples: 8757 - name: test num_bytes: 246104192 num_examples: 3610 download_size: 3408308518 dataset_size: 6220570567 configs: - config_name: ctxs1 data_files: - split: train path: ctxs1/train-* - split: eval path: ctxs1/eval-* - split: test path: ctxs1/test-* - config_name: ctxs100 data_files: - split: train path: ctxs100/train-* - split: eval path: ctxs100/eval-* - split: test path: ctxs100/test-* - config_name: ctxs5 data_files: - split: train path: ctxs5/train-* - split: eval path: ctxs5/eval-* - split: test path: ctxs5/test-* ---
提供机构:
Xnhyacinth
原始信息汇总

数据集概述

数据集配置

  • config_name: ctxs1

    • 特征:
      • id: 类型 int64
      • answers: 序列类型 string
      • question: 类型 string
      • compressed_prompt: 结构类型
        • compressed_prompt: 类型 string
        • compressed_tokens: 类型 int64
        • origin_tokens: 类型 int64
        • ratio: 类型 string
        • saving: 类型 string
      • ctxs: 列表类型
        • id: 类型 string
        • text: 类型 string
        • title: 类型 string
    • 分割:
      • train: 字节数 5212377086, 样本数 79168
      • eval: 字节数 576466670, 样本数 8757
      • test: 字节数 238448436, 样本数 3610
    • 下载大小: 3334114023
    • 数据集大小: 6027292192
  • config_name: ctxs100

    • 特征:
      • question: 类型 string
      • compressed_prompt: 结构类型
        • compressed_prompt: 类型 string
        • compressed_tokens: 类型 int64
        • origin_tokens: 类型 int64
        • ratio: 类型 string
        • saving: 类型 string
      • answers: 序列类型 string
      • id: 类型 int64
      • ctxs: 列表类型
        • id: 类型 string
        • text: 类型 string
        • title: 类型 string
    • 分割:
      • train: 字节数 5316136683, 样本数 79168
      • eval: 字节数 587931406, 样本数 8757
      • test: 字节数 243224578, 样本数 3610
    • 下载大小: 3413758169
    • 数据集大小: 6147292667
  • config_name: ctxs5

    • 特征:
      • id: 类型 int64
      • answers: 序列类型 string
      • question: 类型 string
      • compressed_prompt: 结构类型
        • compressed_prompt: 类型 string
        • compressed_tokens: 类型 int64
        • origin_tokens: 类型 int64
        • ratio: 类型 string
        • saving: 类型 string
      • ctxs: 列表类型
        • id: 类型 string
        • score: 类型 float64
        • text: 类型 string
        • title: 类型 string
    • 分割:
      • train: 字节数 5379479786, 样本数 79168
      • eval: 字节数 594986589, 样本数 8757
      • test: 字节数 246104192, 样本数 3610
    • 下载大小: 3408308518
    • 数据集大小: 6220570567

数据文件路径

  • config_name: ctxs1

    • train: ctxs1/train-*
    • eval: ctxs1/eval-*
    • test: ctxs1/test-*
  • config_name: ctxs100

    • train: ctxs100/train-*
    • eval: ctxs100/eval-*
    • test: ctxs100/test-*
  • config_name: ctxs5

    • train: ctxs5/train-*
    • eval: ctxs5/eval-*
    • test: ctxs5/test-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作