sproos/1m-embeddings-v3-large
收藏Hugging Face2024-03-13 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/sproos/1m-embeddings-v3-large
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含两个主要特征:文本(text)和嵌入(embedding),其中文本数据类型为字符串,嵌入为浮点数序列。数据集主要分为训练集,训练集包含超过114万样本,总数据大小约为136亿字节,下载大小约为98亿字节。数据集的默认配置中,训练数据文件路径为data/train-*。
提供机构:
sproos
原始信息汇总
数据集概述
数据集特征
- text:字符串类型
- embedding:序列类型,数据类型为
float64
数据集分割
- train:
- 示例数量:1141728
- 数据大小:13597743149字节
数据集大小
- 下载大小:9847492139字节
- 数据集总大小:13597743149字节



