five

In2Training/VaLProbing-32K

收藏
Hugging Face2024-04-15 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/In2Training/VaLProbing-32K
下载链接
链接失效反馈
官方服务:
资源简介:
--- license: mit dataset_info: features: - name: prompt dtype: string - name: completion dtype: string - name: set_id dtype: int64 - name: position_id dtype: int64 - name: label dtype: string - name: description dtype: string splits: - name: document_bi_32k num_bytes: 414417632 num_examples: 3200 - name: code_backward_32k num_bytes: 247574073 num_examples: 3200 - name: database_forward_32k num_bytes: 268852430 num_examples: 3000 download_size: 515780530 dataset_size: 930844135 configs: - config_name: default data_files: - split: document_bi_32k path: data/document_bi_32k-* - split: code_backward_32k path: data/code_backward_32k-* - split: database_forward_32k path: data/database_forward_32k-* --- For the usage of VaLProbing-32K, see the guidance in [https://github.com/microsoft/FILM/](https://github.com/microsoft/FILM/).

许可证:MIT 数据集信息: 特征: - 名称:提示词 数据类型:字符串 - 名称:完成内容 数据类型:字符串 - 名称:集合ID 数据类型:int64 - 名称:位置ID 数据类型:int64 - 名称:标签 数据类型:字符串 - 名称:描述 数据类型:字符串 拆分: - 名称:document_bi_32k 字节数:414417632 样本数:3200 - 名称:code_backward_32k 字节数:247574073 样本数:3200 - 名称:database_forward_32k 字节数:268852430 样本数:3000 下载大小:515780530 数据集大小:930844135 配置: - 配置名称:默认 数据文件: - 拆分:document_bi_32k 路径:data/document_bi_32k-* - 拆分:code_backward_32k 路径:data/code_backward_32k-* - 拆分:database_forward_32k 路径:data/database_forward_32k-* 关于VaLProbing-32K的使用方法,请参见[https://github.com/microsoft/FILM/](https://github.com/microsoft/FILM/)中的指南。
提供机构:
In2Training
原始信息汇总

数据集概述

数据集特征

  • prompt: 数据类型为字符串
  • completion: 数据类型为字符串
  • set_id: 数据类型为整数64位
  • position_id: 数据类型为整数64位
  • label: 数据类型为字符串
  • description: 数据类型为字符串

数据集分割

  • document_bi_32k: 包含3200个示例,总字节数为414417632
  • code_backward_32k: 包含3200个示例,总字节数为247574073
  • database_forward_32k: 包含3000个示例,总字节数为268852430

数据集大小

  • 下载大小: 515780530字节
  • 数据集大小: 930844135字节

配置信息

  • config_name: default
  • data_files:
    • split: document_bi_32k
      • path: data/document_bi_32k-*
    • split: code_backward_32k
      • path: data/code_backward_32k-*
    • split: database_forward_32k
      • path: data/database_forward_32k-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作