In2Training/VaLProbing-32K
收藏Hugging Face2024-04-15 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/In2Training/VaLProbing-32K
下载链接
链接失效反馈官方服务:
资源简介:
---
license: mit
dataset_info:
features:
- name: prompt
dtype: string
- name: completion
dtype: string
- name: set_id
dtype: int64
- name: position_id
dtype: int64
- name: label
dtype: string
- name: description
dtype: string
splits:
- name: document_bi_32k
num_bytes: 414417632
num_examples: 3200
- name: code_backward_32k
num_bytes: 247574073
num_examples: 3200
- name: database_forward_32k
num_bytes: 268852430
num_examples: 3000
download_size: 515780530
dataset_size: 930844135
configs:
- config_name: default
data_files:
- split: document_bi_32k
path: data/document_bi_32k-*
- split: code_backward_32k
path: data/code_backward_32k-*
- split: database_forward_32k
path: data/database_forward_32k-*
---
For the usage of VaLProbing-32K, see the guidance in [https://github.com/microsoft/FILM/](https://github.com/microsoft/FILM/).
许可证:MIT
数据集信息:
特征:
- 名称:提示词
数据类型:字符串
- 名称:完成内容
数据类型:字符串
- 名称:集合ID
数据类型:int64
- 名称:位置ID
数据类型:int64
- 名称:标签
数据类型:字符串
- 名称:描述
数据类型:字符串
拆分:
- 名称:document_bi_32k
字节数:414417632
样本数:3200
- 名称:code_backward_32k
字节数:247574073
样本数:3200
- 名称:database_forward_32k
字节数:268852430
样本数:3000
下载大小:515780530
数据集大小:930844135
配置:
- 配置名称:默认
数据文件:
- 拆分:document_bi_32k
路径:data/document_bi_32k-*
- 拆分:code_backward_32k
路径:data/code_backward_32k-*
- 拆分:database_forward_32k
路径:data/database_forward_32k-*
关于VaLProbing-32K的使用方法,请参见[https://github.com/microsoft/FILM/](https://github.com/microsoft/FILM/)中的指南。
提供机构:
In2Training
原始信息汇总
数据集概述
数据集特征
- prompt: 数据类型为字符串
- completion: 数据类型为字符串
- set_id: 数据类型为整数64位
- position_id: 数据类型为整数64位
- label: 数据类型为字符串
- description: 数据类型为字符串
数据集分割
- document_bi_32k: 包含3200个示例,总字节数为414417632
- code_backward_32k: 包含3200个示例,总字节数为247574073
- database_forward_32k: 包含3000个示例,总字节数为268852430
数据集大小
- 下载大小: 515780530字节
- 数据集大小: 930844135字节
配置信息
- config_name: default
- data_files:
- split: document_bi_32k
- path: data/document_bi_32k-*
- split: code_backward_32k
- path: data/code_backward_32k-*
- split: database_forward_32k
- path: data/database_forward_32k-*
- split: document_bi_32k



