christopher/stack-smol-xxl-embeddings
收藏Hugging Face2023-06-01 更新2024-05-25 收录
下载链接:
https://hf-mirror.com/datasets/christopher/stack-smol-xxl-embeddings
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: token_ids
sequence: int64
- name: lri_160
sequence: float64
splits:
- name: train
num_bytes: 231978165104
num_examples: 11658586
download_size: 34909750705
dataset_size: 231978165104
---
# Dataset Card for "stack-smol-xxl-1"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
christopher
原始信息汇总
数据集概述
数据集名称
stack-smol-xxl-1
数据集特征
- token_ids:整数序列,类型为
int64。 - lri_160:浮点数序列,类型为
float64。
数据集分割
- train:包含11658586个样本,总大小为231978165104字节。
数据集大小
- 下载大小:34909750705字节
- 数据集总大小:231978165104字节



