five

Self-GRIT/wikitext-2-raw-v1-preprocessed-200-PI_KFI_claude-claude-3-5-sonnet-20240620

收藏
Hugging Face2024-07-18 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/Self-GRIT/wikitext-2-raw-v1-preprocessed-200-PI_KFI_claude-claude-3-5-sonnet-20240620
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多个特征字段,包括文本、消息和输出检索等。消息字段进一步细分为内容和角色,输出检索字段包含更新后的段落、错误和结果等子字段。数据集被分割为训练集,包含200个示例,总大小为2842044字节。下载大小为750585字节。

This dataset includes multiple feature fields such as text, messages, and outputs_retrievals. The messages field is further divided into content and role, and the outputs_retrievals field includes subfields like Updated_Passage, error, and results. The dataset is split into a training set containing 200 examples, with a total size of 2842044 bytes. The download size is 750585 bytes.
提供机构:
Self-GRIT
原始信息汇总

数据集概述

数据集信息

  • 特征:
    • text: 数据类型为 string
    • messages: 包含以下子特征的列表:
      • content: 数据类型为 string
      • role: 数据类型为 string
    • outputs_retrievals: 包含以下子特征的结构:
      • Updated_Passage: 数据类型为 string
      • error: 数据类型为 int64
      • results: 包含以下子特征的列表:
        • Explanation: 数据类型为 string
        • Ideal_Knowledge: 数据类型为 string
        • Key_Factual_Information: 数据类型为 string
        • Prefix_intent: 数据类型为 string
        • Prefix_reformulated: 数据类型为 string
        • Verification: 数据类型为 string

数据集划分

  • train:
    • num_bytes: 2842044 字节
    • num_examples: 200 个样本

数据集大小

  • download_size: 750585 字节
  • dataset_size: 2842044 字节

配置

  • config_name: default
    • data_files:
      • split: train
      • path: data/train-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作