vnktrmnb/autotrain-data-qa_xlm_roberta_large_tesquad2
收藏Hugging Face2023-05-22 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/vnktrmnb/autotrain-data-qa_xlm_roberta_large_tesquad2
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是为项目qa_xlm_roberta_large_tesquad2自动处理的问答数据集。数据集中包含上下文、问题、答案文本、答案起始位置和特征ID等字段。数据集的语言代码为unk,未明确指定语言。数据集分为训练集和验证集,训练集包含64549个样本,验证集包含9277个样本。
提供机构:
vnktrmnb
原始信息汇总
数据集概述
数据集基本信息
- 项目名称: qa_xlm_roberta_large_tesquad2
- 语言: 数据集的语言代码为unk,具体语言未知。
数据集结构
数据实例
数据集中的每个实例包含以下字段:
- context: 文本内容,描述相关背景信息。
- question: 提出的问题。
- answers.text: 问题的答案文本。
- answers.answer_start: 答案在context中的起始位置。
- feat_id: 特征标识符。
数据集字段
数据集包含以下字段:
- context: 字符串类型。
- question: 字符串类型。
- answers.text: 字符串序列类型。
- answers.answer_start: 整数序列类型。
- feat_id: 字符串序列类型。
数据集分割
数据集被分割为训练集和验证集,具体分割如下:
| 分割名称 | 样本数量 |
|---|---|
| 训练集 | 64549 |
| 验证集 | 9277 |



