Self-GRIT/wikitext-2-raw-v1-preprocessed-5k-PI_KFI_claude-claude-3-5-sonnet-20240620
收藏Hugging Face2024-07-17 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/Self-GRIT/wikitext-2-raw-v1-preprocessed-5k-PI_KFI_claude-claude-3-5-sonnet-20240620
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含三个主要特征:text、messages和outputs。text特征是一个字符串类型的数据,messages特征是一个列表,包含content和role两个字符串类型的子特征。outputs特征是一个结构体,包含Updated_Passage、none和results三个子特征,其中results是一个列表,包含多个字符串类型的子特征。数据集包含一个名为train的分割,包含5000个示例,总大小为56253541字节。数据集的下载大小为11831350字节。
The dataset contains three main features: text, messages, and outputs. The text feature is a string type data. The messages feature is a list containing two string type sub-features: content and role. The outputs feature is a structure containing three sub-features: Updated_Passage, none, and results, where results is a list containing multiple string type sub-features. The dataset includes a split named train with 5000 examples and a total size of 56253541 bytes. The download size of the dataset is 11831350 bytes.
提供机构:
Self-GRIT
原始信息汇总
数据集概述
数据集信息
特征
- text: 数据类型为
string。 - messages: 包含以下子特征:
- content: 数据类型为
string。 - role: 数据类型为
string。
- content: 数据类型为
- outputs: 包含以下子特征:
- Updated_Passage: 数据类型为
string。 - none: 数据类型为
string。 - results: 包含以下子特征:
- Explanation: 数据类型为
string。 - Ideal Knowledge: 数据类型为
string。 - Key Factual Information: 数据类型为
string。 - Prefix reformulated: 数据类型为
string。 - Prefix-intent: 数据类型为
string。 - Verification: 数据类型为
string。
- Explanation: 数据类型为
- Updated_Passage: 数据类型为
数据分割
- train: 包含 5000 个样本,占用 56253541 字节。
数据集大小
- 下载大小: 11831350 字节
- 数据集大小: 56253541 字节
配置
- default: 包含训练数据文件,路径为
data/train-*。



