hgissbkh/CMedQAv2-reranking-model-scores
收藏Hugging Face2024-05-22 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/hgissbkh/CMedQAv2-reranking-model-scores
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为gte-large-zh,包含查询(query)、文档(docs)以及多个不同模型的嵌入向量(如multilingual-e5-small, multilingual-e5-base, multilingual-e5-large, stella-mrl-large-zh-v3.5-1792d, acge_text_embedding, gte-large-zh)和目标(target)。数据集分为训练集(train),包含1000个样本,总大小为36041770字节,下载大小为24308955字节。
本数据集命名为gte-large-zh,包含查询(query)、文档(docs)、多款不同模型生成的嵌入向量(涵盖multilingual-e5-small、multilingual-e5-base、multilingual-e5-large、stella-mrl-large-zh-v3.5-1792d、acge_text_embedding、gte-large-zh)以及目标(target)。该数据集划分为训练集(train),共包含1000个样本,总存储大小为36041770字节,下载占用大小为24308955字节。
提供机构:
hgissbkh
原始信息汇总
数据集概述
数据集配置名称
- 名称: gte-large-zh
数据集特征
- query: 字符串类型
- docs: 字符串序列类型
- multilingual-e5-small: 浮点数序列类型
- multilingual-e5-base: 浮点数序列类型
- multilingual-e5-large: 浮点数序列类型
- stella-mrl-large-zh-v3.5-1792d: 浮点数序列类型
- acge_text_embedding: 浮点数序列类型
- gte-large-zh: 浮点数序列类型
- target: 整数序列类型
数据集分割
- 训练集:
- 字节数: 36041770
- 示例数: 1000
数据集大小
- 下载大小: 24308955
- 数据集大小: 36041770
数据文件路径
- 训练集路径: gte-large-zh/train-*



