IAmSkyDra/HCMUT_FAQ

Name: IAmSkyDra/HCMUT_FAQ
Creator: IAmSkyDra
Published: 2024-07-06 17:48:07
License: 暂无描述

Hugging Face2024-07-06 更新2024-07-22 收录

下载链接：

https://hf-mirror.com/datasets/IAmSkyDra/HCMUT_FAQ

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含用于问答和文本生成任务的越南语教育数据。数据集分为训练集和验证集，训练集包含1964个样本，验证集包含32个样本。每个样本包含instruction、input和output三个字段，数据类型均为字符串。数据集的总下载大小为89447字节，总数据集大小为525906字节。

This dataset contains Vietnamese educational data for question-answering and text-generation tasks. The dataset is divided into a training set and a validation set, with the training set containing 1964 samples and the validation set containing 32 samples. Each sample includes three fields: instruction, input, and output, all of which are of string type. The total download size of the dataset is 89447 bytes, and the total dataset size is 525906 bytes.

提供机构：

IAmSkyDra

原始信息汇总

数据集概述

许可证

MIT许可证

数据集信息

特征

instruction: 字符串类型
input: 字符串类型
output: 字符串类型

数据分割

train:
- 字节数: 522366
- 样本数: 1964
validation:
- 字节数: 3540
- 样本数: 32

数据大小

下载大小: 89447字节
数据集大小: 525906字节

配置

default:
- 数据文件:
  - train: data/train-*
  - validation: data/validation-*

任务类别

问答
文本生成

语言

越南语

数据集规模

1K < n < 10K

5,000+

优质数据集

54 个

任务类型

进入经典数据集