five

Self-GRIT/wikitext-2-raw-v1-preprocessed-4k-PI_KFI_claude-claude-3-5-sonnet-20240620

收藏
Hugging Face2024-07-17 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/Self-GRIT/wikitext-2-raw-v1-preprocessed-4k-PI_KFI_claude-claude-3-5-sonnet-20240620
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含三个主要特征:text(文本)、messages(消息列表,包含content和role两个子特征)和outputs_retrievals(检索输出结构,包含Updated_Passage、error和results等子特征)。数据集只有一个训练集(train),包含4000个样本,文件大小为55408743字节,下载大小为13786630字节。

This dataset is primarily used for text analysis and processing, featuring three main characteristics: text, messages, and outputs_retrievals. The text feature is a string type, the messages feature includes two sub-features: content and role, both of which are string types. The outputs_retrievals feature is a struct, including three sub-features: Updated_Passage, error, and results. Updated_Passage is a string type, error is an int64 type, and results is a list containing multiple string type sub-features for further analysis and verification. The dataset contains only the training split, with a total of 4000 samples and a size of 55408743 bytes.
提供机构:
Self-GRIT
原始信息汇总

数据集概述

数据集信息

  • 特征:
    • text: 数据类型为 string
    • messages: 包含以下子特征的列表:
      • content: 数据类型为 string
      • role: 数据类型为 string
    • outputs_retrievals: 包含以下子特征的结构:
      • Updated_Passage: 数据类型为 string
      • error: 数据类型为 int64
      • results: 包含以下子特征的列表:
        • Explanation: 数据类型为 string
        • Ideal_Knowledge: 数据类型为 string
        • Key_Factual_Information: 数据类型为 string
        • Prefix_intent: 数据类型为 string
        • Prefix_reformulated: 数据类型为 string
        • Verification: 数据类型为 string

数据集分割

  • train:
    • 样本数量: 4000
    • 字节数: 55408743

数据集大小

  • 下载大小: 13786630 字节
  • 数据集总大小: 55408743 字节

配置

  • default:
    • 数据文件:
      • train: 路径为 data/train-*
搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作