five

rachid16/Retrival_evaluation_dataset_scores_MOD

收藏
Hugging Face2024-05-08 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/rachid16/Retrival_evaluation_dataset_scores_MOD
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: question dtype: string - name: context dtype: string - name: chunks sequence: string - name: num_chunks dtype: int64 - name: relvent_doc sequence: int64 - name: ndcg dtype: float64 - name: mrr dtype: float64 - name: hit_rate dtype: int64 splits: - name: train num_bytes: 8184328 num_examples: 1000 download_size: 3759094 dataset_size: 8184328 configs: - config_name: default data_files: - split: train path: data/train-* ---

数据集信息(dataset_info): 特征(features): - 特征名称:问题(question),数据类型(dtype):字符串(string) - 特征名称:上下文(context),数据类型(dtype):字符串(string) - 特征名称:分块(chunks),数据类型(dtype):字符串序列(sequence<string>) - 特征名称:分块数量(num_chunks),数据类型(dtype):64位整数(int64) - 特征名称:相关文档(relvent_doc),数据类型(dtype):64位整数序列(sequence<int64>) - 特征名称:归一化折损累计增益(ndcg),数据类型(dtype):64位浮点数(float64) - 特征名称:平均倒数排名(mrr),数据类型(dtype):64位浮点数(float64) - 特征名称:命中率(hit_rate),数据类型(dtype):64位整数(int64) 数据集划分(splits): - 划分名称:训练集(train),字节数(num_bytes):8184328,样本数(num_examples):1000 下载大小(download_size):3759094 数据集总大小(dataset_size):8184328 配置项(configs): - 配置名称:默认配置(default),数据文件(data_files): - 对应划分:训练集(train),文件路径:data/train-*
提供机构:
rachid16
原始信息汇总

数据集概述

数据集特征

  • question: 数据类型为字符串。
  • context: 数据类型为字符串。
  • chunks: 数据类型为字符串序列。
  • num_chunks: 数据类型为整数(int64)。
  • relvent_doc: 数据类型为整数序列(int64)。
  • ndcg: 数据类型为浮点数(float64)。
  • mrr: 数据类型为浮点数(float64)。
  • hit_rate: 数据类型为整数(int64)。

数据集拆分

  • train: 包含1000个示例,总大小为8184328字节。

数据集大小

  • 下载大小: 3759094字节。
  • 数据集大小: 8184328字节。

配置

  • config_name: default
  • data_files:
    • split: train
    • path: data/train-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作