harouzie/vi_question_generation
收藏Hugging Face2023-09-04 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/harouzie/vi_question_generation
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个用于抽取式问答和问题生成的越南语数据集,包含训练集、测试集和验证集。每个样本包含上下文、问题、答案和ID四个特征。数据集的大小类别为100K到1M之间,适用于问答和文本生成任务。
提供机构:
harouzie
原始信息汇总
数据集概述
许可证
- MIT
配置
- 默认配置
- 数据文件
- 训练集:
data/train-* - 测试集:
data/test-* - 验证集:
data/valid-*
- 训练集:
- 数据文件
数据集信息
-
特征
- 上下文: 字符串
- 问题: 字符串
- 答案: 字符串
- ID: 字符串
-
数据分割
- 训练集
- 字节数: 211814961.2307449
- 样本数: 174499
- 测试集
- 字节数: 26477628.80776531
- 样本数: 21813
- 验证集
- 字节数: 26476414.961489797
- 样本数: 21812
- 训练集
-
下载大小: 142790671
-
数据集大小: 264769005
任务类别
- 问答
- 文本生成
语言
- 越南语
数据集名称
- Vietnamese Dataset for Extractive Question Answering and Question Generation
数据集大小类别
- 100K<n<1M



