imperialwarrior/open-australian-legal-qa-paraphrased-hard-gemini-with-emb
收藏Hugging Face2024-03-10 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/imperialwarrior/open-australian-legal-qa-paraphrased-hard-gemini-with-emb
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: pipeline_1_result
dtype: string
- name: pipeline_1_result_r_embeddings
sequence: float64
- name: pipeline_1_result_nr_embeddings
sequence: float64
- name: pipeline_2_context
dtype: string
- name: pipeline_2_result
dtype: string
- name: pipeline_2_result_r_embeddings
sequence: float64
- name: pipeline_2_result_nr_embeddings
sequence: float64
- name: pipeline_3_context
dtype: string
- name: pipeline_3_result
dtype: string
- name: pipeline_3_result_r_embeddings
sequence: float64
- name: pipeline_3_result_nr_embeddings
sequence: float64
- name: pipeline_4_context
dtype: string
- name: pipeline_4_result
dtype: string
- name: pipeline_4_result_r_embeddings
sequence: float64
- name: pipeline_4_result_nr_embeddings
sequence: float64
- name: pipeline_5_context
dtype: string
- name: pipeline_5_result
dtype: string
- name: pipeline_5_result_r_embeddings
sequence: float64
- name: pipeline_5_result_nr_embeddings
sequence: float64
- name: pipeline_6_context
dtype: string
- name: pipeline_6_result
dtype: string
- name: pipeline_6_result_r_embeddings
sequence: float64
- name: pipeline_6_result_nr_embeddings
sequence: float64
- name: pipeline_7_context
dtype: string
- name: pipeline_7_result
dtype: string
- name: pipeline_7_result_r_embeddings
sequence: float64
- name: pipeline_7_result_nr_embeddings
sequence: float64
- name: referenced_question
dtype: string
- name: answer
dtype: string
- name: answer_non_retrieval_embeddings
dtype: string
- name: answer_retrieval_embeddings
dtype: string
- name: question
dtype: string
- name: question_retrieval_embeddings
dtype: string
- name: question_non_retrieval_embeddings
dtype: string
- name: __index_level_0__
dtype: float64
- name: case_index
dtype: float64
- name: pipeline_6_case_indexes
sequence: int64
- name: pipeline_7_case_indexes
sequence: int64
splits:
- name: train
num_bytes: 134099471
num_examples: 203
download_size: 32075501
dataset_size: 134099471
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
数据集信息:
特征字段:
- 名称:pipeline_1_result,数据类型:字符串(string)
- 名称:pipeline_1_result_r_embeddings,数据类型:64位浮点数序列(float64)
- 名称:pipeline_1_result_nr_embeddings,数据类型:64位浮点数序列(float64)
- 名称:pipeline_2_context,数据类型:字符串(string)
- 名称:pipeline_2_result,数据类型:字符串(string)
- 名称:pipeline_2_result_r_embeddings,数据类型:64位浮点数序列(float64)
- 名称:pipeline_2_result_nr_embeddings,数据类型:64位浮点数序列(float64)
- 名称:pipeline_3_context,数据类型:字符串(string)
- 名称:pipeline_3_result,数据类型:字符串(string)
- 名称:pipeline_3_result_r_embeddings,数据类型:64位浮点数序列(float64)
- 名称:pipeline_3_result_nr_embeddings,数据类型:64位浮点数序列(float64)
- 名称:pipeline_4_context,数据类型:字符串(string)
- 名称:pipeline_4_result,数据类型:字符串(string)
- 名称:pipeline_4_result_r_embeddings,数据类型:64位浮点数序列(float64)
- 名称:pipeline_4_result_nr_embeddings,数据类型:64位浮点数序列(float64)
- 名称:pipeline_5_context,数据类型:字符串(string)
- 名称:pipeline_5_result,数据类型:字符串(string)
- 名称:pipeline_5_result_r_embeddings,数据类型:64位浮点数序列(float64)
- 名称:pipeline_5_result_nr_embeddings,数据类型:64位浮点数序列(float64)
- 名称:pipeline_6_context,数据类型:字符串(string)
- 名称:pipeline_6_result,数据类型:字符串(string)
- 名称:pipeline_6_result_r_embeddings,数据类型:64位浮点数序列(float64)
- 名称:pipeline_6_result_nr_embeddings,数据类型:64位浮点数序列(float64)
- 名称:pipeline_7_context,数据类型:字符串(string)
- 名称:pipeline_7_result,数据类型:字符串(string)
- 名称:pipeline_7_result_r_embeddings,数据类型:64位浮点数序列(float64)
- 名称:pipeline_7_result_nr_embeddings,数据类型:64位浮点数序列(float64)
- 名称:referenced_question,数据类型:字符串(string)
- 名称:answer,数据类型:字符串(string)
- 名称:answer_non_retrieval_embeddings,数据类型:字符串(string)
- 名称:answer_retrieval_embeddings,数据类型:字符串(string)
- 名称:question,数据类型:字符串(string)
- 名称:question_retrieval_embeddings,数据类型:字符串(string)
- 名称:question_non_retrieval_embeddings,数据类型:字符串(string)
- 名称:__index_level_0__,数据类型:64位浮点数(float64)
- 名称:case_index,数据类型:64位浮点数(float64)
- 名称:pipeline_6_case_indexes,数据类型:64位整数序列(int64)
- 名称:pipeline_7_case_indexes,数据类型:64位整数序列(int64)
数据集划分:
- 名称:train(训练集),字节占用:134099471,样本数量:203
下载总大小:32075501
数据集总占用大小:134099471
配置项:
- 配置名称:default(默认配置),数据文件:
- 划分集:train(训练集),文件路径:data/train-*
提供机构:
imperialwarrior
原始信息汇总
数据集概述
数据特征
数据集包含以下特征:
- pipeline_1_result: 字符串类型
- pipeline_1_result_r_embeddings: 序列类型,浮点数64位
- pipeline_1_result_nr_embeddings: 序列类型,浮点数64位
- pipeline_2_context: 字符串类型
- pipeline_2_result: 字符串类型
- pipeline_2_result_r_embeddings: 序列类型,浮点数64位
- pipeline_2_result_nr_embeddings: 序列类型,浮点数64位
- pipeline_3_context: 字符串类型
- pipeline_3_result: 字符串类型
- pipeline_3_result_r_embeddings: 序列类型,浮点数64位
- pipeline_3_result_nr_embeddings: 序列类型,浮点数64位
- pipeline_4_context: 字符串类型
- pipeline_4_result: 字符串类型
- pipeline_4_result_r_embeddings: 序列类型,浮点数64位
- pipeline_4_result_nr_embeddings: 序列类型,浮点数64位
- pipeline_5_context: 字符串类型
- pipeline_5_result: 字符串类型
- pipeline_5_result_r_embeddings: 序列类型,浮点数64位
- pipeline_5_result_nr_embeddings: 序列类型,浮点数64位
- pipeline_6_context: 字符串类型
- pipeline_6_result: 字符串类型
- pipeline_6_result_r_embeddings: 序列类型,浮点数64位
- pipeline_6_result_nr_embeddings: 序列类型,浮点数64位
- pipeline_7_context: 字符串类型
- pipeline_7_result: 字符串类型
- pipeline_7_result_r_embeddings: 序列类型,浮点数64位
- pipeline_7_result_nr_embeddings: 序列类型,浮点数64位
- referenced_question: 字符串类型
- answer: 字符串类型
- answer_non_retrieval_embeddings: 字符串类型
- answer_retrieval_embeddings: 字符串类型
- question: 字符串类型
- question_retrieval_embeddings: 字符串类型
- question_non_retrieval_embeddings: 字符串类型
- index_level_0: 浮点数64位
- case_index: 浮点数64位
- pipeline_6_case_indexes: 序列类型,整数64位
- pipeline_7_case_indexes: 序列类型,整数64位
数据分割
- train: 包含203个样本,总字节数为134099471
数据集大小
- 下载大小: 32075501字节
- 数据集大小: 134099471字节
配置
- default:
- 数据文件路径: data/train-*



