imperialwarrior/open-australian-legal-qa-paraphrased-hard-gemini
收藏Hugging Face2024-03-10 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/imperialwarrior/open-australian-legal-qa-paraphrased-hard-gemini
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: index
dtype: 'null'
- name: pipeline_1_result
dtype: string
- name: pipeline_1_result_embeddings
dtype: string
- name: pipeline_2_context
dtype: string
- name: pipeline_2_result
dtype: string
- name: pipeline_2_result_embeddings
dtype: string
- name: pipeline_3_context
dtype: string
- name: pipeline_3_result
dtype: string
- name: pipeline_3_result_embeddings
dtype: string
- name: pipeline_4_context
dtype: string
- name: pipeline_4_result
dtype: string
- name: pipeline_4_result_embeddings
dtype: string
- name: pipeline_5_context
dtype: string
- name: pipeline_5_result
dtype: string
- name: pipeline_5_result_embeddings
dtype: string
- name: pipeline_6_context
dtype: string
- name: pipeline_6_result
dtype: string
- name: pipeline_6_result_embeddings
dtype: string
- name: pipeline_7_context
dtype: string
- name: pipeline_7_result
dtype: string
- name: pipeline_7_result_embeddings
dtype: string
- name: referenced_question
dtype: string
- name: answer
dtype: string
- name: question
dtype: string
- name: question_non_retrieval_embeddings
dtype: string
- name: answer_non_retrieval_embeddings
dtype: string
- name: question_retrieval_embeddings
dtype: string
- name: answer_retrieval_embeddings
dtype: string
- name: __index_level_0__
dtype: float64
- name: case_index
dtype: float64
- name: pipeline_6_case_indexes
sequence: int64
- name: pipeline_7_case_indexes
sequence: int64
splits:
- name: train
num_bytes: 40967131
num_examples: 203
download_size: 14378490
dataset_size: 40967131
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
数据集信息:
特征字段:
- 字段名:index,数据类型:空类型
- 字段名:流水线1结果(pipeline_1_result),数据类型:字符串
- 字段名:流水线1结果嵌入向量(pipeline_1_result_embeddings),数据类型:字符串
- 字段名:流水线2上下文(pipeline_2_context),数据类型:字符串
- 字段名:流水线2结果(pipeline_2_result),数据类型:字符串
- 字段名:流水线2结果嵌入向量(pipeline_2_result_embeddings),数据类型:字符串
- 字段名:流水线3上下文(pipeline_3_context),数据类型:字符串
- 字段名:流水线3结果(pipeline_3_result),数据类型:字符串
- 字段名:流水线3结果嵌入向量(pipeline_3_result_embeddings),数据类型:字符串
- 字段名:流水线4上下文(pipeline_4_context),数据类型:字符串
- 字段名:流水线4结果(pipeline_4_result),数据类型:字符串
- 字段名:流水线4结果嵌入向量(pipeline_4_result_embeddings),数据类型:字符串
- 字段名:流水线5上下文(pipeline_5_context),数据类型:字符串
- 字段名:流水线5结果(pipeline_5_result),数据类型:字符串
- 字段名:流水线5结果嵌入向量(pipeline_5_result_embeddings),数据类型:字符串
- 字段名:流水线6上下文(pipeline_6_context),数据类型:字符串
- 字段名:流水线6结果(pipeline_6_result),数据类型:字符串
- 字段名:流水线6结果嵌入向量(pipeline_6_result_embeddings),数据类型:字符串
- 字段名:流水线7上下文(pipeline_7_context),数据类型:字符串
- 字段名:流水线7结果(pipeline_7_result),数据类型:字符串
- 字段名:流水线7结果嵌入向量(pipeline_7_result_embeddings),数据类型:字符串
- 字段名:参考问题(referenced_question),数据类型:字符串
- 字段名:答案(answer),数据类型:字符串
- 字段名:问题(question),数据类型:字符串
- 字段名:问题非检索嵌入向量(question_non_retrieval_embeddings),数据类型:字符串
- 字段名:答案非检索嵌入向量(answer_non_retrieval_embeddings),数据类型:字符串
- 字段名:问题检索嵌入向量(question_retrieval_embeddings),数据类型:字符串
- 字段名:答案检索嵌入向量(answer_retrieval_embeddings),数据类型:字符串
- 字段名:__index_level_0__,数据类型:64位浮点型
- 字段名:案例索引(case_index),数据类型:64位浮点型
- 字段名:流水线6案例索引序列(pipeline_6_case_indexes),数据类型:64位整型序列
- 字段名:流水线7案例索引序列(pipeline_7_case_indexes),数据类型:64位整型序列
数据集划分:
- 划分名称:训练集(train),字节占用量:40967131,样本总数:203
下载总大小:14378490,数据集总存储大小:40967131
数据集配置:
- 配置名称:默认配置(default),数据文件:
- 数据划分:训练集(train),文件路径:data/train-*
提供机构:
imperialwarrior
原始信息汇总
数据集概述
特征信息
数据集包含以下特征:
index: 数据类型为nullpipeline_1_result: 数据类型为stringpipeline_1_result_embeddings: 数据类型为stringpipeline_2_context: 数据类型为stringpipeline_2_result: 数据类型为stringpipeline_2_result_embeddings: 数据类型为stringpipeline_3_context: 数据类型为stringpipeline_3_result: 数据类型为stringpipeline_3_result_embeddings: 数据类型为stringpipeline_4_context: 数据类型为stringpipeline_4_result: 数据类型为stringpipeline_4_result_embeddings: 数据类型为stringpipeline_5_context: 数据类型为stringpipeline_5_result: 数据类型为stringpipeline_5_result_embeddings: 数据类型为stringpipeline_6_context: 数据类型为stringpipeline_6_result: 数据类型为stringpipeline_6_result_embeddings: 数据类型为stringpipeline_7_context: 数据类型为stringpipeline_7_result: 数据类型为stringpipeline_7_result_embeddings: 数据类型为stringreferenced_question: 数据类型为stringanswer: 数据类型为stringquestion: 数据类型为stringquestion_non_retrieval_embeddings: 数据类型为stringanswer_non_retrieval_embeddings: 数据类型为stringquestion_retrieval_embeddings: 数据类型为stringanswer_retrieval_embeddings: 数据类型为string__index_level_0__: 数据类型为float64case_index: 数据类型为float64pipeline_6_case_indexes: 数据类型为int64序列pipeline_7_case_indexes: 数据类型为int64序列
数据分割
数据集包含一个分割:
train: 包含 203 个样本,占用 40967131 字节
数据集大小
- 下载大小: 14378490 字节
- 数据集大小: 40967131 字节
配置信息
- 配置名称:
default - 数据文件路径:
data/train-*



