five

imperialwarrior/open-australian-legal-qa-paraphrased-hard-gemini

收藏
Hugging Face2024-03-10 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/imperialwarrior/open-australian-legal-qa-paraphrased-hard-gemini
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: index dtype: 'null' - name: pipeline_1_result dtype: string - name: pipeline_1_result_embeddings dtype: string - name: pipeline_2_context dtype: string - name: pipeline_2_result dtype: string - name: pipeline_2_result_embeddings dtype: string - name: pipeline_3_context dtype: string - name: pipeline_3_result dtype: string - name: pipeline_3_result_embeddings dtype: string - name: pipeline_4_context dtype: string - name: pipeline_4_result dtype: string - name: pipeline_4_result_embeddings dtype: string - name: pipeline_5_context dtype: string - name: pipeline_5_result dtype: string - name: pipeline_5_result_embeddings dtype: string - name: pipeline_6_context dtype: string - name: pipeline_6_result dtype: string - name: pipeline_6_result_embeddings dtype: string - name: pipeline_7_context dtype: string - name: pipeline_7_result dtype: string - name: pipeline_7_result_embeddings dtype: string - name: referenced_question dtype: string - name: answer dtype: string - name: question dtype: string - name: question_non_retrieval_embeddings dtype: string - name: answer_non_retrieval_embeddings dtype: string - name: question_retrieval_embeddings dtype: string - name: answer_retrieval_embeddings dtype: string - name: __index_level_0__ dtype: float64 - name: case_index dtype: float64 - name: pipeline_6_case_indexes sequence: int64 - name: pipeline_7_case_indexes sequence: int64 splits: - name: train num_bytes: 40967131 num_examples: 203 download_size: 14378490 dataset_size: 40967131 configs: - config_name: default data_files: - split: train path: data/train-* ---

数据集信息: 特征字段: - 字段名:index,数据类型:空类型 - 字段名:流水线1结果(pipeline_1_result),数据类型:字符串 - 字段名:流水线1结果嵌入向量(pipeline_1_result_embeddings),数据类型:字符串 - 字段名:流水线2上下文(pipeline_2_context),数据类型:字符串 - 字段名:流水线2结果(pipeline_2_result),数据类型:字符串 - 字段名:流水线2结果嵌入向量(pipeline_2_result_embeddings),数据类型:字符串 - 字段名:流水线3上下文(pipeline_3_context),数据类型:字符串 - 字段名:流水线3结果(pipeline_3_result),数据类型:字符串 - 字段名:流水线3结果嵌入向量(pipeline_3_result_embeddings),数据类型:字符串 - 字段名:流水线4上下文(pipeline_4_context),数据类型:字符串 - 字段名:流水线4结果(pipeline_4_result),数据类型:字符串 - 字段名:流水线4结果嵌入向量(pipeline_4_result_embeddings),数据类型:字符串 - 字段名:流水线5上下文(pipeline_5_context),数据类型:字符串 - 字段名:流水线5结果(pipeline_5_result),数据类型:字符串 - 字段名:流水线5结果嵌入向量(pipeline_5_result_embeddings),数据类型:字符串 - 字段名:流水线6上下文(pipeline_6_context),数据类型:字符串 - 字段名:流水线6结果(pipeline_6_result),数据类型:字符串 - 字段名:流水线6结果嵌入向量(pipeline_6_result_embeddings),数据类型:字符串 - 字段名:流水线7上下文(pipeline_7_context),数据类型:字符串 - 字段名:流水线7结果(pipeline_7_result),数据类型:字符串 - 字段名:流水线7结果嵌入向量(pipeline_7_result_embeddings),数据类型:字符串 - 字段名:参考问题(referenced_question),数据类型:字符串 - 字段名:答案(answer),数据类型:字符串 - 字段名:问题(question),数据类型:字符串 - 字段名:问题非检索嵌入向量(question_non_retrieval_embeddings),数据类型:字符串 - 字段名:答案非检索嵌入向量(answer_non_retrieval_embeddings),数据类型:字符串 - 字段名:问题检索嵌入向量(question_retrieval_embeddings),数据类型:字符串 - 字段名:答案检索嵌入向量(answer_retrieval_embeddings),数据类型:字符串 - 字段名:__index_level_0__,数据类型:64位浮点型 - 字段名:案例索引(case_index),数据类型:64位浮点型 - 字段名:流水线6案例索引序列(pipeline_6_case_indexes),数据类型:64位整型序列 - 字段名:流水线7案例索引序列(pipeline_7_case_indexes),数据类型:64位整型序列 数据集划分: - 划分名称:训练集(train),字节占用量:40967131,样本总数:203 下载总大小:14378490,数据集总存储大小:40967131 数据集配置: - 配置名称:默认配置(default),数据文件: - 数据划分:训练集(train),文件路径:data/train-*
提供机构:
imperialwarrior
原始信息汇总

数据集概述

特征信息

数据集包含以下特征:

  • index: 数据类型为 null
  • pipeline_1_result: 数据类型为 string
  • pipeline_1_result_embeddings: 数据类型为 string
  • pipeline_2_context: 数据类型为 string
  • pipeline_2_result: 数据类型为 string
  • pipeline_2_result_embeddings: 数据类型为 string
  • pipeline_3_context: 数据类型为 string
  • pipeline_3_result: 数据类型为 string
  • pipeline_3_result_embeddings: 数据类型为 string
  • pipeline_4_context: 数据类型为 string
  • pipeline_4_result: 数据类型为 string
  • pipeline_4_result_embeddings: 数据类型为 string
  • pipeline_5_context: 数据类型为 string
  • pipeline_5_result: 数据类型为 string
  • pipeline_5_result_embeddings: 数据类型为 string
  • pipeline_6_context: 数据类型为 string
  • pipeline_6_result: 数据类型为 string
  • pipeline_6_result_embeddings: 数据类型为 string
  • pipeline_7_context: 数据类型为 string
  • pipeline_7_result: 数据类型为 string
  • pipeline_7_result_embeddings: 数据类型为 string
  • referenced_question: 数据类型为 string
  • answer: 数据类型为 string
  • question: 数据类型为 string
  • question_non_retrieval_embeddings: 数据类型为 string
  • answer_non_retrieval_embeddings: 数据类型为 string
  • question_retrieval_embeddings: 数据类型为 string
  • answer_retrieval_embeddings: 数据类型为 string
  • __index_level_0__: 数据类型为 float64
  • case_index: 数据类型为 float64
  • pipeline_6_case_indexes: 数据类型为 int64 序列
  • pipeline_7_case_indexes: 数据类型为 int64 序列

数据分割

数据集包含一个分割:

  • train: 包含 203 个样本,占用 40967131 字节

数据集大小

  • 下载大小: 14378490 字节
  • 数据集大小: 40967131 字节

配置信息

  • 配置名称: default
  • 数据文件路径: data/train-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作