Self-GRIT/wikitext-2-raw-v1-preprocessed-200-PP_RIP_PTP_claude-claude-3-5-sonnet-20240620
收藏Hugging Face2024-07-25 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/Self-GRIT/wikitext-2-raw-v1-preprocessed-200-PP_RIP_PTP_claude-claude-3-5-sonnet-20240620
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含三个主要特征:text、messages和outputs_retrievals。messages是一个列表,包含content和role两个字段;outputs_retrievals是一个结构体,包含Updated_Passage、error和results三个字段,其中results又是一个列表,包含多个字段。数据集只有一个分割train,包含198个样本,总大小为1473948.63字节。
The dataset contains three main features: text, messages, and outputs_retrievals. messages is a list containing two fields: content and role; outputs_retrievals is a struct containing three fields: Updated_Passage, error, and results, where results is a list containing multiple fields. The dataset has only one split, train, which contains 198 samples with a total size of 1473948.63 bytes.
提供机构:
Self-GRIT
原始信息汇总
数据集概述
数据集信息
- 特征:
- text: 数据类型为字符串。
- messages: 包含以下子特征的列表:
- content: 数据类型为字符串。
- role: 数据类型为字符串。
- outputs_retrievals: 包含以下子特征的结构:
- Updated_Passage: 数据类型为字符串。
- error: 数据类型为int64。
- results: 包含以下子特征的列表:
- Explanation: 数据类型为字符串。
- Post_passage: 数据类型为字符串。
- Prefix_passage: 数据类型为字符串。
- Prefix_reformulated: 数据类型为字符串。
- Retrieved_information_passage: 数据类型为字符串。
数据集分割
- train:
- num_bytes: 1473948.63
- num_examples: 198
数据集大小
- download_size: 486776
- dataset_size: 1473948.63
配置
- config_name: default
- data_files:
- split: train
- path: data/train-*
- data_files:



