iamnguyen/edu_child_v3

Name: iamnguyen/edu_child_v3
Creator: iamnguyen
Published: 2023-12-18 07:48:21
License: 暂无描述

Hugging Face2023-12-18 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/iamnguyen/edu_child_v3

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含两个主要特征：content和metadata。content是一个字符串类型的数据，而metadata是一个结构体，包含多个子字段，如answer、id、question、school_id、seq_num、source、tokenized_question和vector。此外，数据集还包含一个名为vector的序列特征，其数据类型为float64。数据集只有一个训练集（train），包含435个样本，总大小为9319896字节。

提供机构：

iamnguyen

原始信息汇总

数据集概述

数据特征

content: 数据类型为字符串。
metadata: 结构化数据，包含以下字段：
- answer: 数据类型为字符串。
- id: 数据类型为字符串。
- question: 数据类型为字符串。
- school_id: 数据类型为字符串。
- seq_num: 数据类型为整数（int64）。
- source: 数据类型为字符串。
- tokenized_question: 数据类型为字符串。
- vector: 数据类型为浮点数序列（float64）。
vector: 数据类型为浮点数序列（float64）。

数据分割

train: 包含435个样本，总字节数为9319896。

数据集大小

下载大小: 6460457字节。
数据集大小: 9319896字节。

配置

default: 数据文件路径为data/train-*。

5,000+

优质数据集

54 个

任务类型

进入经典数据集