five

Self-GRIT/wikitext-2-raw-v1-preprocessed-200-PI_KFI_claude-claude-3-5-sonnet-20240620-FK_claude

收藏
Hugging Face2024-07-18 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/Self-GRIT/wikitext-2-raw-v1-preprocessed-200-PI_KFI_claude-claude-3-5-sonnet-20240620-FK_claude
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含三个主要特征:text、messages和outputs_retrievals。text是一个字符串类型的特征,messages是一个列表,包含content和role两个字符串类型的子特征。outputs_retrievals是一个结构体,包含Updated_Passage(字符串类型)、error(int64类型)和results(一个列表,包含Generated_Knowledge、Key_Factual_Information和Prefix_intent三个字符串类型的子特征)。数据集只有一个训练集(train),包含200个样本,总大小为1929423字节,下载大小为830457字节。

The dataset includes three main features: text, messages, and outputs_retrievals. The text feature is of string type, messages is a list containing content and role sub-features, both of string type. outputs_retrievals is a struct containing Updated_Passage, error, and results sub-features. Updated_Passage is of string type, error is of integer type, and results is a list containing Generated_Knowledge, Key_Factual_Information, and Prefix_intent sub-features, all of string type. The dataset is divided into a training set with 200 samples, with a total size of 1929423 bytes.
提供机构:
Self-GRIT
原始信息汇总

数据集概述

数据集信息

  • 特征:
    • text: 数据类型为 string
    • messages: 包含以下子特征的列表:
      • content: 数据类型为 string
      • role: 数据类型为 string
    • outputs_retrievals: 包含以下子特征的结构:
      • Updated_Passage: 数据类型为 string
      • error: 数据类型为 int64
      • results: 包含以下子特征的列表:
        • Generated_Knowledge: 数据类型为 string
        • Key_Factual_Information: 数据类型为 string
        • Prefix_intent: 数据类型为 string

数据集分割

  • train:
    • num_bytes: 1929423 字节
    • num_examples: 200 个样本

数据集大小

  • download_size: 830457 字节
  • dataset_size: 1929423 字节

配置

  • config_name: default
    • data_files:
      • split: train
      • path: data/train-*
二维码
社区交流群
二维码
科研交流群
商业服务