Self-GRIT/wikitext-2-raw-v1-preprocessed-200-PI_KFI_claude-claude-3-5-sonnet-20240620
收藏Hugging Face2024-07-18 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/Self-GRIT/wikitext-2-raw-v1-preprocessed-200-PI_KFI_claude-claude-3-5-sonnet-20240620
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个特征字段,包括文本、消息和输出检索等。消息字段进一步细分为内容和角色,输出检索字段包含更新后的段落、错误和结果等子字段。数据集被分割为训练集,包含200个示例,总大小为2842044字节。下载大小为750585字节。
This dataset includes multiple feature fields such as text, messages, and outputs_retrievals. The messages field is further divided into content and role, and the outputs_retrievals field includes subfields like Updated_Passage, error, and results. The dataset is split into a training set containing 200 examples, with a total size of 2842044 bytes. The download size is 750585 bytes.
提供机构:
Self-GRIT
原始信息汇总
数据集概述
数据集信息
- 特征:
- text: 数据类型为
string。 - messages: 包含以下子特征的列表:
- content: 数据类型为
string。 - role: 数据类型为
string。
- content: 数据类型为
- outputs_retrievals: 包含以下子特征的结构:
- Updated_Passage: 数据类型为
string。 - error: 数据类型为
int64。 - results: 包含以下子特征的列表:
- Explanation: 数据类型为
string。 - Ideal_Knowledge: 数据类型为
string。 - Key_Factual_Information: 数据类型为
string。 - Prefix_intent: 数据类型为
string。 - Prefix_reformulated: 数据类型为
string。 - Verification: 数据类型为
string。
- Explanation: 数据类型为
- Updated_Passage: 数据类型为
- text: 数据类型为
数据集划分
- train:
- num_bytes: 2842044 字节
- num_examples: 200 个样本
数据集大小
- download_size: 750585 字节
- dataset_size: 2842044 字节
配置
- config_name: default
- data_files:
- split: train
- path: data/train-*
- data_files:



