five

imperialwarrior/open-australian-legal-qa-paraphrased-hard-gemini-with-emb

收藏
Hugging Face2024-03-10 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/imperialwarrior/open-australian-legal-qa-paraphrased-hard-gemini-with-emb
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: pipeline_1_result dtype: string - name: pipeline_1_result_r_embeddings sequence: float64 - name: pipeline_1_result_nr_embeddings sequence: float64 - name: pipeline_2_context dtype: string - name: pipeline_2_result dtype: string - name: pipeline_2_result_r_embeddings sequence: float64 - name: pipeline_2_result_nr_embeddings sequence: float64 - name: pipeline_3_context dtype: string - name: pipeline_3_result dtype: string - name: pipeline_3_result_r_embeddings sequence: float64 - name: pipeline_3_result_nr_embeddings sequence: float64 - name: pipeline_4_context dtype: string - name: pipeline_4_result dtype: string - name: pipeline_4_result_r_embeddings sequence: float64 - name: pipeline_4_result_nr_embeddings sequence: float64 - name: pipeline_5_context dtype: string - name: pipeline_5_result dtype: string - name: pipeline_5_result_r_embeddings sequence: float64 - name: pipeline_5_result_nr_embeddings sequence: float64 - name: pipeline_6_context dtype: string - name: pipeline_6_result dtype: string - name: pipeline_6_result_r_embeddings sequence: float64 - name: pipeline_6_result_nr_embeddings sequence: float64 - name: pipeline_7_context dtype: string - name: pipeline_7_result dtype: string - name: pipeline_7_result_r_embeddings sequence: float64 - name: pipeline_7_result_nr_embeddings sequence: float64 - name: referenced_question dtype: string - name: answer dtype: string - name: answer_non_retrieval_embeddings dtype: string - name: answer_retrieval_embeddings dtype: string - name: question dtype: string - name: question_retrieval_embeddings dtype: string - name: question_non_retrieval_embeddings dtype: string - name: __index_level_0__ dtype: float64 - name: case_index dtype: float64 - name: pipeline_6_case_indexes sequence: int64 - name: pipeline_7_case_indexes sequence: int64 splits: - name: train num_bytes: 134099471 num_examples: 203 download_size: 32075501 dataset_size: 134099471 configs: - config_name: default data_files: - split: train path: data/train-* ---

数据集信息: 特征字段: - 名称:pipeline_1_result,数据类型:字符串(string) - 名称:pipeline_1_result_r_embeddings,数据类型:64位浮点数序列(float64) - 名称:pipeline_1_result_nr_embeddings,数据类型:64位浮点数序列(float64) - 名称:pipeline_2_context,数据类型:字符串(string) - 名称:pipeline_2_result,数据类型:字符串(string) - 名称:pipeline_2_result_r_embeddings,数据类型:64位浮点数序列(float64) - 名称:pipeline_2_result_nr_embeddings,数据类型:64位浮点数序列(float64) - 名称:pipeline_3_context,数据类型:字符串(string) - 名称:pipeline_3_result,数据类型:字符串(string) - 名称:pipeline_3_result_r_embeddings,数据类型:64位浮点数序列(float64) - 名称:pipeline_3_result_nr_embeddings,数据类型:64位浮点数序列(float64) - 名称:pipeline_4_context,数据类型:字符串(string) - 名称:pipeline_4_result,数据类型:字符串(string) - 名称:pipeline_4_result_r_embeddings,数据类型:64位浮点数序列(float64) - 名称:pipeline_4_result_nr_embeddings,数据类型:64位浮点数序列(float64) - 名称:pipeline_5_context,数据类型:字符串(string) - 名称:pipeline_5_result,数据类型:字符串(string) - 名称:pipeline_5_result_r_embeddings,数据类型:64位浮点数序列(float64) - 名称:pipeline_5_result_nr_embeddings,数据类型:64位浮点数序列(float64) - 名称:pipeline_6_context,数据类型:字符串(string) - 名称:pipeline_6_result,数据类型:字符串(string) - 名称:pipeline_6_result_r_embeddings,数据类型:64位浮点数序列(float64) - 名称:pipeline_6_result_nr_embeddings,数据类型:64位浮点数序列(float64) - 名称:pipeline_7_context,数据类型:字符串(string) - 名称:pipeline_7_result,数据类型:字符串(string) - 名称:pipeline_7_result_r_embeddings,数据类型:64位浮点数序列(float64) - 名称:pipeline_7_result_nr_embeddings,数据类型:64位浮点数序列(float64) - 名称:referenced_question,数据类型:字符串(string) - 名称:answer,数据类型:字符串(string) - 名称:answer_non_retrieval_embeddings,数据类型:字符串(string) - 名称:answer_retrieval_embeddings,数据类型:字符串(string) - 名称:question,数据类型:字符串(string) - 名称:question_retrieval_embeddings,数据类型:字符串(string) - 名称:question_non_retrieval_embeddings,数据类型:字符串(string) - 名称:__index_level_0__,数据类型:64位浮点数(float64) - 名称:case_index,数据类型:64位浮点数(float64) - 名称:pipeline_6_case_indexes,数据类型:64位整数序列(int64) - 名称:pipeline_7_case_indexes,数据类型:64位整数序列(int64) 数据集划分: - 名称:train(训练集),字节占用:134099471,样本数量:203 下载总大小:32075501 数据集总占用大小:134099471 配置项: - 配置名称:default(默认配置),数据文件: - 划分集:train(训练集),文件路径:data/train-*
提供机构:
imperialwarrior
原始信息汇总

数据集概述

数据特征

数据集包含以下特征:

  • pipeline_1_result: 字符串类型
  • pipeline_1_result_r_embeddings: 序列类型,浮点数64位
  • pipeline_1_result_nr_embeddings: 序列类型,浮点数64位
  • pipeline_2_context: 字符串类型
  • pipeline_2_result: 字符串类型
  • pipeline_2_result_r_embeddings: 序列类型,浮点数64位
  • pipeline_2_result_nr_embeddings: 序列类型,浮点数64位
  • pipeline_3_context: 字符串类型
  • pipeline_3_result: 字符串类型
  • pipeline_3_result_r_embeddings: 序列类型,浮点数64位
  • pipeline_3_result_nr_embeddings: 序列类型,浮点数64位
  • pipeline_4_context: 字符串类型
  • pipeline_4_result: 字符串类型
  • pipeline_4_result_r_embeddings: 序列类型,浮点数64位
  • pipeline_4_result_nr_embeddings: 序列类型,浮点数64位
  • pipeline_5_context: 字符串类型
  • pipeline_5_result: 字符串类型
  • pipeline_5_result_r_embeddings: 序列类型,浮点数64位
  • pipeline_5_result_nr_embeddings: 序列类型,浮点数64位
  • pipeline_6_context: 字符串类型
  • pipeline_6_result: 字符串类型
  • pipeline_6_result_r_embeddings: 序列类型,浮点数64位
  • pipeline_6_result_nr_embeddings: 序列类型,浮点数64位
  • pipeline_7_context: 字符串类型
  • pipeline_7_result: 字符串类型
  • pipeline_7_result_r_embeddings: 序列类型,浮点数64位
  • pipeline_7_result_nr_embeddings: 序列类型,浮点数64位
  • referenced_question: 字符串类型
  • answer: 字符串类型
  • answer_non_retrieval_embeddings: 字符串类型
  • answer_retrieval_embeddings: 字符串类型
  • question: 字符串类型
  • question_retrieval_embeddings: 字符串类型
  • question_non_retrieval_embeddings: 字符串类型
  • index_level_0: 浮点数64位
  • case_index: 浮点数64位
  • pipeline_6_case_indexes: 序列类型,整数64位
  • pipeline_7_case_indexes: 序列类型,整数64位

数据分割

  • train: 包含203个样本,总字节数为134099471

数据集大小

  • 下载大小: 32075501字节
  • 数据集大小: 134099471字节

配置

  • default:
    • 数据文件路径: data/train-*
二维码
社区交流群
二维码
科研交流群
商业服务