chriztopherton/DATA255_LAB2_P3_RAFT
收藏Hugging Face2024-04-25 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/chriztopherton/DATA255_LAB2_P3_RAFT
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: id
dtype: string
- name: type
dtype: string
- name: question
dtype: string
- name: context
struct:
- name: sentences
sequence:
sequence: string
- name: title
sequence:
sequence: string
- name: oracle_context
dtype: string
- name: cot_answer
dtype: string
- name: instruction
dtype: string
- name: text
dtype: string
splits:
- name: train
num_bytes: 3480756
num_examples: 326
download_size: 706991
dataset_size: 3480756
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
数据集信息:
特征:
- 字段名:id,数据类型:字符串
- 字段名:type,数据类型:字符串
- 字段名:question,数据类型:字符串
- 字段名:context,为结构体类型,包含两个子字段:
- 子字段名:sentences,数据类型为嵌套字符串序列(即字符串序列的序列)
- 子字段名:title,数据类型为嵌套字符串序列(即字符串序列的序列)
- 字段名:oracle_context(金标准上下文),数据类型:字符串
- 字段名:cot_answer,数据类型:字符串(其中cot为思维链(Chain of Thought)的缩写)
- 字段名:instruction,数据类型:字符串
- 字段名:text,数据类型:字符串
数据集划分:
- 划分名称:训练集(train),占用字节数:3480756,样本数量:326
下载总大小:706991字节,数据集实际占用大小:3480756字节
数据集配置:
- 配置名称:默认配置(default),数据文件:
- 对应划分:训练集(train),文件路径:data/train-*
提供机构:
chriztopherton
原始信息汇总
数据集概述
数据集特征
- id: 数据类型为字符串。
- type: 数据类型为字符串。
- question: 数据类型为字符串。
- context: 结构化数据,包含两个子特征:
- sentences: 序列类型,数据类型为字符串。
- title: 序列类型,数据类型为字符串。
- oracle_context: 数据类型为字符串。
- cot_answer: 数据类型为字符串。
- instruction: 数据类型为字符串。
- text: 数据类型为字符串。
数据集分割
- train:
- 数据大小: 3480756 字节
- 示例数量: 326
数据集大小
- 下载大小: 706991 字节
- 数据集总大小: 3480756 字节



