iamnguyen/edu_child

Name: iamnguyen/edu_child
Creator: iamnguyen
Published: 2023-12-18 02:28:51
License: 暂无描述

Hugging Face2023-12-18 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/iamnguyen/edu_child

下载链接

链接失效反馈

官方服务：

资源简介：

--- dataset_info: features: - name: content dtype: string - name: metadata struct: - name: metadata struct: - name: answer dtype: string - name: id dtype: string - name: question dtype: string - name: school_id dtype: string - name: seq_num dtype: int64 - name: source dtype: string - name: tokenized_question dtype: string - name: vector sequence: float64 - name: vector sequence: float64 splits: - name: train num_bytes: 14168658 num_examples: 678 download_size: 8946207 dataset_size: 14168658 configs: - config_name: default data_files: - split: train path: data/train-* ---

数据集信息：特征列表： 1. 特征名称：content，数据类型：字符串 2. 特征名称：metadata（元数据），类型为结构体，其内部嵌套子结构体metadata（元数据），该子结构体包含以下字段： - 字段名：answer，数据类型：字符串 - 字段名：id，数据类型：字符串 - 字段名：question，数据类型：字符串 - 字段名：school_id，数据类型：字符串 - 字段名：seq_num，数据类型：64位整型（int64） - 字段名：source，数据类型：字符串 - 字段名：tokenized_question，数据类型：字符串 - 字段名：vector（向量），数据类型为64位浮点型（float64）序列 3. 特征名称：vector（向量），数据类型为64位浮点型（float64）序列数据集划分： - 划分名称：train（训练集），占用存储空间14168658字节，样本总数678 下载总大小：8946207字节，数据集总存储大小：14168658字节配置项： - 配置名称：default（默认配置），数据文件配置： - 对应数据集划分：train（训练集），文件路径：data/train-*

提供机构：

iamnguyen

原始信息汇总

数据集概述

数据集信息

特征

content: 数据类型为字符串。
metadata: 结构化数据，包含以下字段：
- answer: 数据类型为字符串。
- id: 数据类型为字符串。
- question: 数据类型为字符串。
- school_id: 数据类型为字符串。
- seq_num: 数据类型为整数（int64）。
- source: 数据类型为字符串。
- tokenized_question: 数据类型为字符串。
- vector: 数据类型为浮点数序列（float64）。
vector: 数据类型为浮点数序列（float64）。