five

imperialwarrior/open-australian-legal-qa-paraphrased-easy-gemini

收藏
Hugging Face2024-03-10 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/imperialwarrior/open-australian-legal-qa-paraphrased-easy-gemini
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: index dtype: 'null' - name: pipeline_1_result dtype: string - name: pipeline_1_result_embeddings dtype: string - name: pipeline_2_context dtype: string - name: pipeline_2_result dtype: string - name: pipeline_2_result_embeddings dtype: string - name: pipeline_3_context dtype: string - name: pipeline_3_result dtype: string - name: pipeline_3_result_embeddings dtype: string - name: pipeline_4_context dtype: string - name: pipeline_4_result dtype: string - name: pipeline_4_result_embeddings dtype: string - name: pipeline_5_context dtype: string - name: pipeline_5_result dtype: string - name: pipeline_5_result_embeddings dtype: string - name: pipeline_6_context dtype: string - name: pipeline_6_result dtype: string - name: pipeline_6_result_embeddings dtype: string - name: pipeline_7_context dtype: string - name: pipeline_7_result dtype: string - name: pipeline_7_result_embeddings dtype: string - name: referenced_question dtype: string - name: answer dtype: string - name: question dtype: string - name: question_non_retrieval_embeddings dtype: string - name: answer_non_retrieval_embeddings dtype: string - name: question_retrieval_embeddings dtype: string - name: answer_retrieval_embeddings dtype: string - name: __index_level_0__ dtype: float64 - name: case_index dtype: float64 - name: pipeline_6_case_indexes sequence: int64 - name: pipeline_7_case_indexes sequence: int64 splits: - name: train num_bytes: 41703799 num_examples: 207 download_size: 14322382 dataset_size: 41703799 configs: - config_name: default data_files: - split: train path: data/train-* ---
提供机构:
imperialwarrior
原始信息汇总

数据集概述

特征信息

数据集包含以下特征:

  • index: 数据类型为 null
  • pipeline_1_result: 数据类型为 string
  • pipeline_1_result_embeddings: 数据类型为 string
  • pipeline_2_context: 数据类型为 string
  • pipeline_2_result: 数据类型为 string
  • pipeline_2_result_embeddings: 数据类型为 string
  • pipeline_3_context: 数据类型为 string
  • pipeline_3_result: 数据类型为 string
  • pipeline_3_result_embeddings: 数据类型为 string
  • pipeline_4_context: 数据类型为 string
  • pipeline_4_result: 数据类型为 string
  • pipeline_4_result_embeddings: 数据类型为 string
  • pipeline_5_context: 数据类型为 string
  • pipeline_5_result: 数据类型为 string
  • pipeline_5_result_embeddings: 数据类型为 string
  • pipeline_6_context: 数据类型为 string
  • pipeline_6_result: 数据类型为 string
  • pipeline_6_result_embeddings: 数据类型为 string
  • pipeline_7_context: 数据类型为 string
  • pipeline_7_result: 数据类型为 string
  • pipeline_7_result_embeddings: 数据类型为 string
  • referenced_question: 数据类型为 string
  • answer: 数据类型为 string
  • question: 数据类型为 string
  • question_non_retrieval_embeddings: 数据类型为 string
  • answer_non_retrieval_embeddings: 数据类型为 string
  • question_retrieval_embeddings: 数据类型为 string
  • answer_retrieval_embeddings: 数据类型为 string
  • index_level_0: 数据类型为 float64
  • case_index: 数据类型为 float64
  • pipeline_6_case_indexes: 数据类型为 sequence,具体为 int64
  • pipeline_7_case_indexes: 数据类型为 sequence,具体为 int64

数据分割

数据集包含一个分割:

  • train: 包含 207 个样本,总字节数为 41703799

数据集大小

  • 下载大小: 14322382 字节
  • 数据集大小: 41703799 字节

配置信息

  • config_name: default
  • data_files:
    • split: train
    • path: data/train-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作