aidos-lab/arizona-embeddings-mixed-bread-large
收藏Hugging Face2024-07-17 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/aidos-lab/arizona-embeddings-mixed-bread-large
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含文本和对应的嵌入向量,主要用于自然语言处理任务。数据集分为一个训练集,包含28,444个样本。每个样本包含一个文本字符串和一个浮点数序列表示的嵌入向量。数据集总大小为622,113,212字节,下载大小为247,053,716字节。
This dataset contains text and corresponding embeddings, primarily used for natural language processing tasks. The dataset is divided into a training set containing 28,444 samples. Each sample includes a text string and an embedding vector represented as a sequence of floating-point numbers. The total size of the dataset is 622,113,212 bytes, with a download size of 247,053,716 bytes.
提供机构:
aidos-lab
原始信息汇总
数据集概述
数据集信息
-
特征:
- text: 数据类型为字符串。
- embeddings: 数据类型为浮点数序列。
-
分割:
- train: 包含28444个样本,占用622113212字节。
-
下载大小: 247053716字节
-
数据集大小: 622113212字节
配置
- 配置名称: default
- 数据文件:
- train: 路径为
data/train-*。
- train: 路径为
- 数据文件:



