five

Self-GRIT/mini-wikitext-preprocessed-PI_KFI_claude-gpt-4-turbo

收藏
Hugging Face2024-07-18 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/Self-GRIT/mini-wikitext-preprocessed-PI_KFI_claude-gpt-4-turbo
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含文本、消息列表和输出检索结构等特征。消息列表包括内容和角色字段,输出检索结构包括更新段落和结果列表,结果列表进一步包含解释、理想知识、关键事实信息、前缀意图、前缀重构和验证等字段。数据集分为训练集,包含10个示例,总大小为147893字节。

This dataset includes features such as text, a list of messages, and a structure for output retrievals. The list of messages contains fields for content and role, while the output retrieval structure includes an updated passage and a list of results, which further contains fields for explanation, ideal knowledge, key factual information, prefix intent, prefix reformulated, and verification. The dataset is divided into a training set, containing 10 examples, with a total size of 147893 bytes.
提供机构:
Self-GRIT
原始信息汇总

数据集概述

数据集信息

  • 特征:
    • text: 数据类型为字符串。
    • messages: 列表类型,包含以下字段:
      • content: 数据类型为字符串。
      • role: 数据类型为字符串。
    • outputs_retrievals: 结构类型,包含以下字段:
      • Updated_Passage: 数据类型为字符串。
      • results: 列表类型,包含以下字段:
        • Explanation: 数据类型为字符串。
        • Ideal_Knowledge: 数据类型为字符串。
        • Key_Factual_Information: 数据类型为字符串。
        • Prefix_intent: 数据类型为字符串。
        • Prefix_reformulated: 数据类型为字符串。
        • Verification: 数据类型为字符串。

数据集划分

  • train:
    • num_bytes: 147893
    • num_examples: 10

数据集大小

  • download_size: 72133
  • dataset_size: 147893

配置

  • config_name: default
    • data_files:
      • split: train
      • path: data/train-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作