five

Atipico1/WEBQ_adv

收藏
Hugging Face2024-07-21 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/Atipico1/WEBQ_adv
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多个字段,如question(问题)、answers(答案序列)、prompt(提示)、response(响应)等,每个字段都有明确的数据类型定义。数据集还包含一个训练集划分,包含191个样本,总大小为3759215字节。

The dataset contains multiple fields such as question, answers, prompt, response, etc., each with a clearly defined data type. The dataset also includes a training split with 191 examples and a total size of 3759215 bytes.
提供机构:
Atipico1
原始信息汇总

数据集概述

数据集特征

  • question: 问题,数据类型为字符串。
  • answers: 答案,数据类型为字符串序列。
  • prompt: 提示,数据类型为字符串。
  • response: 响应,数据类型为字符串。
  • ctxs: 上下文列表,包含以下字段:
    • hasanswer: 是否有答案,数据类型为布尔值。
    • score: 分数,数据类型为浮点数(float64)。
    • text: 文本,数据类型为字符串。
    • title: 标题,数据类型为字符串。
  • rag_prompt: RAG提示,数据类型为字符串。
  • rag_response: RAG响应,数据类型为字符串。
  • rag_unans_prompt: RAG无答案提示,数据类型为字符串。
  • rag_unans_response: RAG无答案响应,数据类型为字符串。
  • topk: TopK结构,包含以下字段:
    • hasanswer: 是否有答案,数据类型为布尔值。
    • score: 分数,数据类型为浮点数(float64)。
    • text: 文本,数据类型为字符串。
    • title: 标题,数据类型为字符串。
  • is_answerable: 是否可回答,数据类型为布尔值。
  • gpt_adv_passage: GPT高级段落,数据类型为字符串。
  • is_valid_adv_passage: 是否为有效高级段落,数据类型为布尔值。
  • new_ctxs: 新上下文列表,包含以下字段:
    • hasanswer: 是否有答案,数据类型为布尔值。
    • score: 分数,数据类型为浮点数(float64)。
    • text: 文本,数据类型为字符串。
    • title: 标题,数据类型为字符串。
  • is_rag_acc: 是否为RAG准确性,数据类型为布尔值。
  • input: 输入,数据类型为字符串。
  • adv_response: 高级响应,数据类型为字符串。
  • acc: 准确性,数据类型为布尔值。
  • f1: F1分数,数据类型为浮点数(float64)。
  • em: 精确匹配分数,数据类型为浮点数(float64)。

数据集分割

  • train: 训练集,包含191个样本,总字节数为3759215。

数据集大小

  • 下载大小: 2219333字节
  • 数据集大小: 3759215字节

配置

  • config_name: default
    • data_files:
      • split: train
      • path: data/train-*
搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作