aak7912/autotrain-data-auto-nlp-poc
收藏Hugging Face2023-07-17 更新2024-05-25 收录
下载链接:
https://hf-mirror.com/datasets/aak7912/autotrain-data-auto-nlp-poc
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是通过AutoTrain自动处理的,用于项目auto-nlp-poc。数据集的语言为英语(en),包含上下文、问题、答案文本、答案起始位置、特征ID和特征标题等字段。数据集被分为训练集和验证集,分别包含69946和17487个样本。
该数据集是通过AutoTrain自动处理的,用于项目auto-nlp-poc。数据集的语言为英语(en),包含上下文、问题、答案文本、答案起始位置、特征ID和特征标题等字段。数据集被分为训练集和验证集,分别包含69946和17487个样本。
提供机构:
aak7912
原始信息汇总
数据集概述
数据集描述
该数据集是为项目auto-nlp-poc自动处理而生成的,其BCP-47语言代码为en。
数据集结构
数据实例
数据集中的样本包含以下字段:
context: 文本描述question: 问题answers.text: 答案文本answers.answer_start: 答案在context中的起始位置feat_id: 特征IDfeat_title: 特征标题
数据集字段
数据集包含以下字段:
context: 字符串类型question: 字符串类型answers.text: 字符串序列answers.answer_start: 整数序列feat_id: 字符串序列feat_title: 字符串序列
数据集分割
数据集分为训练集和验证集,分割情况如下:
| 分割名称 | 样本数量 |
|---|---|
| 训练集 | 69946 |
| 验证集 | 17487 |
该数据集适用于自然语言处理任务,特别是问答系统。



