imperialwarrior/open-australian-legal-qa-paraphrased-hard-gemini

Name: imperialwarrior/open-australian-legal-qa-paraphrased-hard-gemini
Creator: imperialwarrior
Published: 2024-03-10 08:53:51
License: 暂无描述

Hugging Face2024-03-10 更新2024-06-22 收录

下载链接：

https://hf-mirror.com/datasets/imperialwarrior/open-australian-legal-qa-paraphrased-hard-gemini

下载链接

链接失效反馈

官方服务：

资源简介：

--- dataset_info: features: - name: index dtype: 'null' - name: pipeline_1_result dtype: string - name: pipeline_1_result_embeddings dtype: string - name: pipeline_2_context dtype: string - name: pipeline_2_result dtype: string - name: pipeline_2_result_embeddings dtype: string - name: pipeline_3_context dtype: string - name: pipeline_3_result dtype: string - name: pipeline_3_result_embeddings dtype: string - name: pipeline_4_context dtype: string - name: pipeline_4_result dtype: string - name: pipeline_4_result_embeddings dtype: string - name: pipeline_5_context dtype: string - name: pipeline_5_result dtype: string - name: pipeline_5_result_embeddings dtype: string - name: pipeline_6_context dtype: string - name: pipeline_6_result dtype: string - name: pipeline_6_result_embeddings dtype: string - name: pipeline_7_context dtype: string - name: pipeline_7_result dtype: string - name: pipeline_7_result_embeddings dtype: string - name: referenced_question dtype: string - name: answer dtype: string - name: question dtype: string - name: question_non_retrieval_embeddings dtype: string - name: answer_non_retrieval_embeddings dtype: string - name: question_retrieval_embeddings dtype: string - name: answer_retrieval_embeddings dtype: string - name: __index_level_0__ dtype: float64 - name: case_index dtype: float64 - name: pipeline_6_case_indexes sequence: int64 - name: pipeline_7_case_indexes sequence: int64 splits: - name: train num_bytes: 40967131 num_examples: 203 download_size: 14378490 dataset_size: 40967131 configs: - config_name: default data_files: - split: train path: data/train-* ---

数据集信息：特征字段： - 字段名：index，数据类型：空类型 - 字段名：流水线1结果（pipeline_1_result），数据类型：字符串 - 字段名：流水线1结果嵌入向量（pipeline_1_result_embeddings），数据类型：字符串 - 字段名：流水线2上下文（pipeline_2_context），数据类型：字符串 - 字段名：流水线2结果（pipeline_2_result），数据类型：字符串 - 字段名：流水线2结果嵌入向量（pipeline_2_result_embeddings），数据类型：字符串 - 字段名：流水线3上下文（pipeline_3_context），数据类型：字符串 - 字段名：流水线3结果（pipeline_3_result），数据类型：字符串 - 字段名：流水线3结果嵌入向量（pipeline_3_result_embeddings），数据类型：字符串 - 字段名：流水线4上下文（pipeline_4_context），数据类型：字符串 - 字段名：流水线4结果（pipeline_4_result），数据类型：字符串 - 字段名：流水线4结果嵌入向量（pipeline_4_result_embeddings），数据类型：字符串 - 字段名：流水线5上下文（pipeline_5_context），数据类型：字符串 - 字段名：流水线5结果（pipeline_5_result），数据类型：字符串 - 字段名：流水线5结果嵌入向量（pipeline_5_result_embeddings），数据类型：字符串 - 字段名：流水线6上下文（pipeline_6_context），数据类型：字符串 - 字段名：流水线6结果（pipeline_6_result），数据类型：字符串 - 字段名：流水线6结果嵌入向量（pipeline_6_result_embeddings），数据类型：字符串 - 字段名：流水线7上下文（pipeline_7_context），数据类型：字符串 - 字段名：流水线7结果（pipeline_7_result），数据类型：字符串 - 字段名：流水线7结果嵌入向量（pipeline_7_result_embeddings），数据类型：字符串 - 字段名：参考问题（referenced_question），数据类型：字符串 - 字段名：答案（answer），数据类型：字符串 - 字段名：问题（question），数据类型：字符串 - 字段名：问题非检索嵌入向量（question_non_retrieval_embeddings），数据类型：字符串 - 字段名：答案非检索嵌入向量（answer_non_retrieval_embeddings），数据类型：字符串 - 字段名：问题检索嵌入向量（question_retrieval_embeddings），数据类型：字符串 - 字段名：答案检索嵌入向量（answer_retrieval_embeddings），数据类型：字符串 - 字段名：__index_level_0__，数据类型：64位浮点型 - 字段名：案例索引（case_index），数据类型：64位浮点型 - 字段名：流水线6案例索引序列（pipeline_6_case_indexes），数据类型：64位整型序列 - 字段名：流水线7案例索引序列（pipeline_7_case_indexes），数据类型：64位整型序列数据集划分： - 划分名称：训练集（train），字节占用量：40967131，样本总数：203 下载总大小：14378490，数据集总存储大小：40967131 数据集配置： - 配置名称：默认配置（default），数据文件： - 数据划分：训练集（train），文件路径：data/train-*

提供机构：

imperialwarrior

原始信息汇总

数据集概述

特征信息

数据集包含以下特征：

index: 数据类型为 null
pipeline_1_result: 数据类型为 string
pipeline_1_result_embeddings: 数据类型为 string
pipeline_2_context: 数据类型为 string
pipeline_2_result: 数据类型为 string
pipeline_2_result_embeddings: 数据类型为 string
pipeline_3_context: 数据类型为 string
pipeline_3_result: 数据类型为 string
pipeline_3_result_embeddings: 数据类型为 string
pipeline_4_context: 数据类型为 string
pipeline_4_result: 数据类型为 string
pipeline_4_result_embeddings: 数据类型为 string
pipeline_5_context: 数据类型为 string
pipeline_5_result: 数据类型为 string
pipeline_5_result_embeddings: 数据类型为 string
pipeline_6_context: 数据类型为 string
pipeline_6_result: 数据类型为 string
pipeline_6_result_embeddings: 数据类型为 string
pipeline_7_context: 数据类型为 string
pipeline_7_result: 数据类型为 string
pipeline_7_result_embeddings: 数据类型为 string
referenced_question: 数据类型为 string
answer: 数据类型为 string
question: 数据类型为 string
question_non_retrieval_embeddings: 数据类型为 string
answer_non_retrieval_embeddings: 数据类型为 string
question_retrieval_embeddings: 数据类型为 string
answer_retrieval_embeddings: 数据类型为 string
__index_level_0__: 数据类型为 float64
case_index: 数据类型为 float64
pipeline_6_case_indexes: 数据类型为 int64 序列
pipeline_7_case_indexes: 数据类型为 int64 序列

数据分割

数据集包含一个分割：

train: 包含 203 个样本，占用 40967131 字节

数据集大小

下载大小: 14378490 字节
数据集大小: 40967131 字节

配置信息

配置名称: default
数据文件路径: data/train-*

5,000+

优质数据集

54 个

任务类型

进入经典数据集