Atipico1/WEBQ_adv
收藏Hugging Face2024-07-21 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/Atipico1/WEBQ_adv
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个字段,如question(问题)、answers(答案序列)、prompt(提示)、response(响应)等,每个字段都有明确的数据类型定义。数据集还包含一个训练集划分,包含191个样本,总大小为3759215字节。
The dataset contains multiple fields such as question, answers, prompt, response, etc., each with a clearly defined data type. The dataset also includes a training split with 191 examples and a total size of 3759215 bytes.
提供机构:
Atipico1
原始信息汇总
数据集概述
数据集特征
- question: 问题,数据类型为字符串。
- answers: 答案,数据类型为字符串序列。
- prompt: 提示,数据类型为字符串。
- response: 响应,数据类型为字符串。
- ctxs: 上下文列表,包含以下字段:
- hasanswer: 是否有答案,数据类型为布尔值。
- score: 分数,数据类型为浮点数(float64)。
- text: 文本,数据类型为字符串。
- title: 标题,数据类型为字符串。
- rag_prompt: RAG提示,数据类型为字符串。
- rag_response: RAG响应,数据类型为字符串。
- rag_unans_prompt: RAG无答案提示,数据类型为字符串。
- rag_unans_response: RAG无答案响应,数据类型为字符串。
- topk: TopK结构,包含以下字段:
- hasanswer: 是否有答案,数据类型为布尔值。
- score: 分数,数据类型为浮点数(float64)。
- text: 文本,数据类型为字符串。
- title: 标题,数据类型为字符串。
- is_answerable: 是否可回答,数据类型为布尔值。
- gpt_adv_passage: GPT高级段落,数据类型为字符串。
- is_valid_adv_passage: 是否为有效高级段落,数据类型为布尔值。
- new_ctxs: 新上下文列表,包含以下字段:
- hasanswer: 是否有答案,数据类型为布尔值。
- score: 分数,数据类型为浮点数(float64)。
- text: 文本,数据类型为字符串。
- title: 标题,数据类型为字符串。
- is_rag_acc: 是否为RAG准确性,数据类型为布尔值。
- input: 输入,数据类型为字符串。
- adv_response: 高级响应,数据类型为字符串。
- acc: 准确性,数据类型为布尔值。
- f1: F1分数,数据类型为浮点数(float64)。
- em: 精确匹配分数,数据类型为浮点数(float64)。
数据集分割
- train: 训练集,包含191个样本,总字节数为3759215。
数据集大小
- 下载大小: 2219333字节
- 数据集大小: 3759215字节
配置
- config_name: default
- data_files:
- split: train
- path: data/train-*
- data_files:
搜集汇总
数据集介绍

以上内容由遇见数据集搜集并总结生成



