Mohadese2M/autotrain-data-nma-qa
收藏Hugging Face2023-07-21 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Mohadese2M/autotrain-data-nma-qa
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是为项目nma-qa自动处理的数据集,语言代码为unk,表示语言未知。数据集包含上下文、问题、答案文本、答案起始位置、特征ID和特征标题等字段。数据集被分为训练集和验证集,训练集包含104204个样本,验证集包含26051个样本。
该数据集是为项目nma-qa自动处理的数据集,语言代码为unk,表示语言未知。数据集包含上下文、问题、答案文本、答案起始位置、特征ID和特征标题等字段。数据集被分为训练集和验证集,训练集包含104204个样本,验证集包含26051个样本。
提供机构:
Mohadese2M
原始信息汇总
数据集概述
数据集名称
AutoTrain Dataset for project: nma-qa
语言信息
- 语言代码:unk
数据集结构
数据实例示例
json [ { "context": "...", "question": "...", "answers.text": ["..."], "answers.answer_start": [...], "feat_id": [...], "feat_title": [...] }, { "context": "...", "question": "...", "answers.text": ["..."], "answers.answer_start": [...], "feat_id": [...], "feat_title": [...] } ]
数据集字段
- context: 字符串类型
- question: 字符串类型
- answers.text: 字符串序列
- answers.answer_start: 整数序列
- feat_id: 字符串序列
- feat_title: 字符串序列
数据集分割
| 分割名称 | 样本数量 |
|---|---|
| train | 104204 |
| valid | 26051 |



