Self-GRIT/wikitext-2-raw-v1-preprocessed-4k-PI_KFI_claude-claude-3-5-sonnet-20240620
收藏Hugging Face2024-07-17 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/Self-GRIT/wikitext-2-raw-v1-preprocessed-4k-PI_KFI_claude-claude-3-5-sonnet-20240620
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含三个主要特征:text(文本)、messages(消息列表,包含content和role两个子特征)和outputs_retrievals(检索输出结构,包含Updated_Passage、error和results等子特征)。数据集只有一个训练集(train),包含4000个样本,文件大小为55408743字节,下载大小为13786630字节。
This dataset is primarily used for text analysis and processing, featuring three main characteristics: text, messages, and outputs_retrievals. The text feature is a string type, the messages feature includes two sub-features: content and role, both of which are string types. The outputs_retrievals feature is a struct, including three sub-features: Updated_Passage, error, and results. Updated_Passage is a string type, error is an int64 type, and results is a list containing multiple string type sub-features for further analysis and verification. The dataset contains only the training split, with a total of 4000 samples and a size of 55408743 bytes.
提供机构:
Self-GRIT
原始信息汇总
数据集概述
数据集信息
- 特征:
- text: 数据类型为
string。 - messages: 包含以下子特征的列表:
- content: 数据类型为
string。 - role: 数据类型为
string。
- content: 数据类型为
- outputs_retrievals: 包含以下子特征的结构:
- Updated_Passage: 数据类型为
string。 - error: 数据类型为
int64。 - results: 包含以下子特征的列表:
- Explanation: 数据类型为
string。 - Ideal_Knowledge: 数据类型为
string。 - Key_Factual_Information: 数据类型为
string。 - Prefix_intent: 数据类型为
string。 - Prefix_reformulated: 数据类型为
string。 - Verification: 数据类型为
string。
- Explanation: 数据类型为
- Updated_Passage: 数据类型为
- text: 数据类型为
数据集分割
- train:
- 样本数量: 4000
- 字节数: 55408743
数据集大小
- 下载大小: 13786630 字节
- 数据集总大小: 55408743 字节
配置
- default:
- 数据文件:
- train: 路径为
data/train-*。
- train: 路径为
- 数据文件:
搜集汇总
数据集介绍

以上内容由遇见数据集搜集并总结生成



