Self-GRIT/mini-wikitext-preprocessed-PI_KFI_claude-gpt-4-turbo

Name: Self-GRIT/mini-wikitext-preprocessed-PI_KFI_claude-gpt-4-turbo
Creator: Self-GRIT
Published: 2024-07-18 17:20:21
License: 暂无描述

Hugging Face2024-07-18 更新2024-07-22 收录

下载链接：

https://hf-mirror.com/datasets/Self-GRIT/mini-wikitext-preprocessed-PI_KFI_claude-gpt-4-turbo

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含文本、消息列表和输出检索结构等特征。消息列表包括内容和角色字段，输出检索结构包括更新段落和结果列表，结果列表进一步包含解释、理想知识、关键事实信息、前缀意图、前缀重构和验证等字段。数据集分为训练集，包含10个示例，总大小为147893字节。

This dataset includes features such as text, a list of messages, and a structure for output retrievals. The list of messages contains fields for content and role, while the output retrieval structure includes an updated passage and a list of results, which further contains fields for explanation, ideal knowledge, key factual information, prefix intent, prefix reformulated, and verification. The dataset is divided into a training set, containing 10 examples, with a total size of 147893 bytes.

提供机构：

Self-GRIT

原始信息汇总

数据集概述

数据集信息

特征:
- text: 数据类型为字符串。
- messages: 列表类型，包含以下字段：
  - content: 数据类型为字符串。
  - role: 数据类型为字符串。
- outputs_retrievals: 结构类型，包含以下字段：
  - Updated_Passage: 数据类型为字符串。
  - results: 列表类型，包含以下字段：
    - Explanation: 数据类型为字符串。
    - Ideal_Knowledge: 数据类型为字符串。
    - Key_Factual_Information: 数据类型为字符串。
    - Prefix_intent: 数据类型为字符串。
    - Prefix_reformulated: 数据类型为字符串。
    - Verification: 数据类型为字符串。

数据集划分

train:
- num_bytes: 147893
- num_examples: 10

数据集大小

download_size: 72133
dataset_size: 147893

配置

config_name: default
- data_files:
  - split: train
  - path: data/train-*

5,000+

优质数据集

54 个

任务类型

进入经典数据集