five

Self-GRIT/wikitext-2-raw-v1-preprocessed-5k-PI_KFI_claude-claude-3-5-sonnet-20240620

收藏
Hugging Face2024-07-17 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/Self-GRIT/wikitext-2-raw-v1-preprocessed-5k-PI_KFI_claude-claude-3-5-sonnet-20240620
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含三个主要特征:text、messages和outputs。text特征是一个字符串类型的数据,messages特征是一个列表,包含content和role两个字符串类型的子特征。outputs特征是一个结构体,包含Updated_Passage、none和results三个子特征,其中results是一个列表,包含多个字符串类型的子特征。数据集包含一个名为train的分割,包含5000个示例,总大小为56253541字节。数据集的下载大小为11831350字节。

The dataset contains three main features: text, messages, and outputs. The text feature is a string type data. The messages feature is a list containing two string type sub-features: content and role. The outputs feature is a structure containing three sub-features: Updated_Passage, none, and results, where results is a list containing multiple string type sub-features. The dataset includes a split named train with 5000 examples and a total size of 56253541 bytes. The download size of the dataset is 11831350 bytes.
提供机构:
Self-GRIT
原始信息汇总

数据集概述

数据集信息

特征

  • text: 数据类型为 string
  • messages: 包含以下子特征:
    • content: 数据类型为 string
    • role: 数据类型为 string
  • outputs: 包含以下子特征:
    • Updated_Passage: 数据类型为 string
    • none: 数据类型为 string
    • results: 包含以下子特征:
      • Explanation: 数据类型为 string
      • Ideal Knowledge: 数据类型为 string
      • Key Factual Information: 数据类型为 string
      • Prefix reformulated: 数据类型为 string
      • Prefix-intent: 数据类型为 string
      • Verification: 数据类型为 string

数据分割

  • train: 包含 5000 个样本,占用 56253541 字节。

数据集大小

  • 下载大小: 11831350 字节
  • 数据集大小: 56253541 字节

配置

  • default: 包含训练数据文件,路径为 data/train-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作