Self-GRIT/wikitext-2-raw-v1-preprocessed-200-PI_KFI_claude-claude-3-5-sonnet-20240620-FK_claude
收藏Hugging Face2024-07-18 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/Self-GRIT/wikitext-2-raw-v1-preprocessed-200-PI_KFI_claude-claude-3-5-sonnet-20240620-FK_claude
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含三个主要特征:text、messages和outputs_retrievals。text是一个字符串类型的特征,messages是一个列表,包含content和role两个字符串类型的子特征。outputs_retrievals是一个结构体,包含Updated_Passage(字符串类型)、error(int64类型)和results(一个列表,包含Generated_Knowledge、Key_Factual_Information和Prefix_intent三个字符串类型的子特征)。数据集只有一个训练集(train),包含200个样本,总大小为1929423字节,下载大小为830457字节。
The dataset includes three main features: text, messages, and outputs_retrievals. The text feature is of string type, messages is a list containing content and role sub-features, both of string type. outputs_retrievals is a struct containing Updated_Passage, error, and results sub-features. Updated_Passage is of string type, error is of integer type, and results is a list containing Generated_Knowledge, Key_Factual_Information, and Prefix_intent sub-features, all of string type. The dataset is divided into a training set with 200 samples, with a total size of 1929423 bytes.
提供机构:
Self-GRIT
原始信息汇总
数据集概述
数据集信息
- 特征:
- text: 数据类型为
string。 - messages: 包含以下子特征的列表:
- content: 数据类型为
string。 - role: 数据类型为
string。
- content: 数据类型为
- outputs_retrievals: 包含以下子特征的结构:
- Updated_Passage: 数据类型为
string。 - error: 数据类型为
int64。 - results: 包含以下子特征的列表:
- Generated_Knowledge: 数据类型为
string。 - Key_Factual_Information: 数据类型为
string。 - Prefix_intent: 数据类型为
string。
- Generated_Knowledge: 数据类型为
- Updated_Passage: 数据类型为
- text: 数据类型为
数据集分割
- train:
- num_bytes: 1929423 字节
- num_examples: 200 个样本
数据集大小
- download_size: 830457 字节
- dataset_size: 1929423 字节
配置
- config_name: default
- data_files:
- split: train
- path: data/train-*
- data_files:



