VictorJuiz/Keyword_Doc_intfloat_multilingual_e5
收藏Hugging Face2024-06-03 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/VictorJuiz/Keyword_Doc_intfloat_multilingual_e5
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个越南语数据集,包含查询、文档和标签三个特征。数据集分为训练集和验证集,训练集包含820,064个样本,验证集包含13,530个样本。标签的数据类型为float64。下载大小为683,885,827字节,数据集总大小为1,321,736,608字节。
该数据集是一个越南语数据集,包含查询、文档和标签三个特征。数据集分为训练集和验证集,训练集包含820,064个样本,验证集包含13,530个样本。标签的数据类型为float64。下载大小为683,885,827字节,数据集总大小为1,321,736,608字节。
提供机构:
VictorJuiz
原始信息汇总
数据集概述
数据集基本信息
- 语言: 越南语 (vi)
数据集特征
- query: 数据类型为字符串
- document: 数据类型为字符串
- label: 数据类型为浮点数 (float64)
数据集分割
- 训练集 (train):
- 示例数量: 820064
- 数据大小: 1298042863 字节
- 验证集 (validation):
- 示例数量: 13530
- 数据大小: 23693745 字节
数据集大小
- 下载大小: 683885827 字节
- 总数据集大小: 1321736608 字节
数据文件配置
- 默认配置 (default):
- 训练集路径:
data/train-* - 验证集路径:
data/validation-*
- 训练集路径:



