five

hgissbkh/CMedQAv2-reranking-model-scores

收藏
Hugging Face2024-05-22 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/hgissbkh/CMedQAv2-reranking-model-scores
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为gte-large-zh,包含查询(query)、文档(docs)以及多个不同模型的嵌入向量(如multilingual-e5-small, multilingual-e5-base, multilingual-e5-large, stella-mrl-large-zh-v3.5-1792d, acge_text_embedding, gte-large-zh)和目标(target)。数据集分为训练集(train),包含1000个样本,总大小为36041770字节,下载大小为24308955字节。

本数据集命名为gte-large-zh,包含查询(query)、文档(docs)、多款不同模型生成的嵌入向量(涵盖multilingual-e5-small、multilingual-e5-base、multilingual-e5-large、stella-mrl-large-zh-v3.5-1792d、acge_text_embedding、gte-large-zh)以及目标(target)。该数据集划分为训练集(train),共包含1000个样本,总存储大小为36041770字节,下载占用大小为24308955字节。
提供机构:
hgissbkh
原始信息汇总

数据集概述

数据集配置名称

  • 名称: gte-large-zh

数据集特征

  • query: 字符串类型
  • docs: 字符串序列类型
  • multilingual-e5-small: 浮点数序列类型
  • multilingual-e5-base: 浮点数序列类型
  • multilingual-e5-large: 浮点数序列类型
  • stella-mrl-large-zh-v3.5-1792d: 浮点数序列类型
  • acge_text_embedding: 浮点数序列类型
  • gte-large-zh: 浮点数序列类型
  • target: 整数序列类型

数据集分割

  • 训练集:
    • 字节数: 36041770
    • 示例数: 1000

数据集大小

  • 下载大小: 24308955
  • 数据集大小: 36041770

数据文件路径

  • 训练集路径: gte-large-zh/train-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作