twielema/50EntericDiseaseArticleQADataset
收藏Hugging Face2023-04-12 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/twielema/50EntericDiseaseArticleQADataset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集由AutoTrain自动处理,用于项目entericdisease50articlefinetune。数据集包含上下文、问题、答案及其相关特征的结构。数据集的字段包括上下文、问题、答案文本、答案起始位置、答案ID、文档ID、问题ID、答案结束位置、答案类别和文件名。数据集被分为训练集和验证集,分别包含80和20个样本。
该数据集由AutoTrain自动处理,用于项目entericdisease50articlefinetune。数据集包含上下文、问题、答案及其相关特征的结构。数据集的字段包括上下文、问题、答案文本、答案起始位置、答案ID、文档ID、问题ID、答案结束位置、答案类别和文件名。数据集被分为训练集和验证集,分别包含80和20个样本。
提供机构:
twielema
原始信息汇总
数据集概述
数据集名称
- AutoTrain Dataset for project: entericdisease50articlefinetune
语言
- BCP-47代码:unk
数据集结构
数据实例
- 包含字段:context, question, answers.text, answers.answer_start, feat_answer_id, feat_document_id, feat_question_id, feat_answer_end, feat_answer_category, feat_file_name
数据集字段
- context: 字符串类型
- question: 字符串类型
- answers.text: 字符串序列
- answers.answer_start: 整数序列
- feat_answer_id: 长整数序列
- feat_document_id: 长整数序列
- feat_question_id: 长整数序列
- feat_answer_end: 浮点数序列
- feat_answer_category: 字符串序列
- feat_file_name: 字符串序列
数据集分割
- 训练集:80个样本
- 验证集:20个样本



