bigcode/bigcodebench-embeddings
收藏Hugging Face2024-07-01 更新2024-07-06 收录
下载链接:
https://hf-mirror.com/datasets/bigcode/bigcodebench-embeddings
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含1140个样本,主要用于训练任务。每个样本包含一个任务ID(task_id)和一个嵌入向量(embeddings)。任务ID为字符串类型,嵌入向量为浮点数序列。数据集的总大小为3529470字节,下载大小为4359708字节。数据集仅包含一个训练集(train),数据文件路径为data/train-*。
This dataset contains 1140 samples, primarily used for training tasks. Each sample includes a task ID (task_id) and an embedding vector (embeddings). The task ID is of string type, and the embedding vector is a sequence of float32. The total size of the dataset is 3529470 bytes, with a download size of 4359708 bytes. The dataset includes only a training set (train), with the data file path specified as data/train-*.
提供机构:
bigcode
原始信息汇总
数据集概述
数据集信息
-
特征:
- task_id: 数据类型为字符串。
- embeddings: 数据类型为浮点数序列。
-
分割:
- train: 包含1140个样本,占用3529470字节。
-
文件大小:
- 下载大小: 4359708字节。
- 数据集大小: 3529470字节。
配置
- 默认配置:
- 数据文件:
- train: 路径为
data/train-*。
- train: 路径为
- 数据文件:



