five

Self-GRIT/wikitext-2-raw-v1-preprocessed-200-PP_RIP_PTP_claude-claude-3-5-sonnet-20240620

收藏
Hugging Face2024-07-25 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/Self-GRIT/wikitext-2-raw-v1-preprocessed-200-PP_RIP_PTP_claude-claude-3-5-sonnet-20240620
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含三个主要特征:text、messages和outputs_retrievals。messages是一个列表,包含content和role两个字段;outputs_retrievals是一个结构体,包含Updated_Passage、error和results三个字段,其中results又是一个列表,包含多个字段。数据集只有一个分割train,包含198个样本,总大小为1473948.63字节。

The dataset contains three main features: text, messages, and outputs_retrievals. messages is a list containing two fields: content and role; outputs_retrievals is a struct containing three fields: Updated_Passage, error, and results, where results is a list containing multiple fields. The dataset has only one split, train, which contains 198 samples with a total size of 1473948.63 bytes.
提供机构:
Self-GRIT
原始信息汇总

数据集概述

数据集信息

  • 特征:
    • text: 数据类型为字符串。
    • messages: 包含以下子特征的列表:
      • content: 数据类型为字符串。
      • role: 数据类型为字符串。
    • outputs_retrievals: 包含以下子特征的结构:
      • Updated_Passage: 数据类型为字符串。
      • error: 数据类型为int64。
      • results: 包含以下子特征的列表:
        • Explanation: 数据类型为字符串。
        • Post_passage: 数据类型为字符串。
        • Prefix_passage: 数据类型为字符串。
        • Prefix_reformulated: 数据类型为字符串。
        • Retrieved_information_passage: 数据类型为字符串。

数据集分割

  • train:
    • num_bytes: 1473948.63
    • num_examples: 198

数据集大小

  • download_size: 486776
  • dataset_size: 1473948.63

配置

  • config_name: default
    • data_files:
      • split: train
      • path: data/train-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作