Self-GRIT/mini-wikitext-preprocessed-PI_KFI-gpt-4-turbo
收藏Hugging Face2024-07-16 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/Self-GRIT/mini-wikitext-preprocessed-PI_KFI-gpt-4-turbo
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含文本、消息和输出三个主要部分。文本部分为字符串类型,消息部分包含内容和角色两个字段,均为字符串类型。输出部分是一个结构体,包含更新后的段落和结果列表,结果列表中包含解释、理想知识、关键事实信息、前缀重新表述、前缀意图和验证等字段,均为字符串类型。数据集分为训练集,包含10个示例,总字节数为144076。
The dataset includes three main parts: text, messages, and outputs. The text part is of string type, the messages part contains two fields: content and role, both of which are string types. The outputs part is a structure containing an updated passage and a list of results, which include fields such as Explanation, Ideal Knowledge, Key Factual Information, Prefix reformulated, Prefix-intent, and Verification, all of which are string types. The dataset is divided into a training set, containing 10 examples, with a total byte size of 144076.
提供机构:
Self-GRIT
原始信息汇总
数据集概述
数据集信息
特征
- text: 类型为字符串。
- messages: 列表类型,包含以下字段:
- content: 类型为字符串。
- role: 类型为字符串。
- outputs: 结构类型,包含以下字段:
- Updated_Passage: 类型为字符串。
- results: 列表类型,包含以下字段:
- Explanation: 类型为字符串。
- Ideal Knowledge: 类型为字符串。
- Key Factual Information: 类型为字符串。
- Prefix reformulated: 类型为字符串。
- Prefix-intent: 类型为字符串。
- Verification: 类型为字符串。
数据分割
- train: 包含10个样本,占用144076字节。
数据集大小
- 下载大小: 70883字节。
- 数据集大小: 144076字节。
配置
- default: 包含训练数据文件,路径为
data/train-*。



