five

imperialwarrior/open-australian-legal-qa-paraphrased-hard-gpt-with-emb

收藏
Hugging Face2024-03-13 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/imperialwarrior/open-australian-legal-qa-paraphrased-hard-gpt-with-emb
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多个数据处理pipeline的结果,包括文本数据、上下文信息以及相关的嵌入向量。每个pipeline可能对应不同的数据处理任务,如文本分析、信息检索等。数据集还包含问题和答案的相关信息,以及这些信息的嵌入表示。

该数据集包含多个数据处理pipeline的结果,包括文本数据、上下文信息以及相关的嵌入向量。每个pipeline可能对应不同的数据处理任务,如文本分析、信息检索等。数据集还包含问题和答案的相关信息,以及这些信息的嵌入表示。
提供机构:
imperialwarrior
原始信息汇总

数据集概述

特征信息

数据集包含以下特征:

  • pipeline_1_result: 字符串类型
  • pipeline_1_result_r_embeddings: 浮点数序列
  • pipeline_1_result_nr_embeddings: 浮点数序列
  • pipeline_2_context: 字符串类型
  • pipeline_2_result: 字符串类型
  • pipeline_2_result_r_embeddings: 浮点数序列
  • pipeline_2_result_nr_embeddings: 浮点数序列
  • pipeline_3_context: 字符串类型
  • pipeline_3_result: 字符串类型
  • pipeline_3_result_r_embeddings: 浮点数序列
  • pipeline_3_result_nr_embeddings: 浮点数序列
  • pipeline_4_context: 字符串类型
  • pipeline_4_result: 字符串类型
  • pipeline_4_result_r_embeddings: 浮点数序列
  • pipeline_4_result_nr_embeddings: 浮点数序列
  • pipeline_5_context: 字符串类型
  • pipeline_5_result: 字符串类型
  • pipeline_5_result_r_embeddings: 浮点数序列
  • pipeline_5_result_nr_embeddings: 浮点数序列
  • pipeline_6_context: 字符串类型
  • pipeline_6_result: 字符串类型
  • pipeline_6_result_r_embeddings: 浮点数序列
  • pipeline_6_result_nr_embeddings: 浮点数序列
  • pipeline_7_context: 字符串类型
  • pipeline_7_result: 字符串类型
  • pipeline_7_result_r_embeddings: 浮点数序列
  • pipeline_7_result_nr_embeddings: 浮点数序列
  • referenced_question: 字符串类型
  • answer: 字符串类型
  • answer_non_retrieval_embeddings: 字符串类型
  • answer_retrieval_embeddings: 字符串类型
  • question: 字符串类型
  • question_retrieval_embeddings: 字符串类型
  • question_non_retrieval_embeddings: 字符串类型
  • __index_level_0__: 浮点数类型
  • case_index: 浮点数类型
  • pipeline_6_case_indexes: 整数序列
  • pipeline_7_case_indexes: 整数序列

数据分割

  • train: 包含208个样本,数据大小为138068314字节

数据集大小

  • 下载大小: 33205125字节
  • 数据集大小: 138068314字节

配置信息

  • default配置包含训练数据文件,路径为data/train-*
二维码
社区交流群
二维码
科研交流群
商业服务