timpal0l/jupiter
收藏Hugging Face2024-07-22 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/timpal0l/jupiter
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含四个序列类型的特征字段,分别是input_ids(int32类型),token_type_ids(int8类型),attention_mask(int8类型)和labels(int64类型)。数据集分为训练集,大小为9926747180字节,共有115385个样本。数据集的下载大小为2683147134字节。
The dataset includes four sequence-type feature fields: input_ids (int32 type), token_type_ids (int8 type), attention_mask (int8 type), and labels (int64 type). The dataset is split into a training set, which is 9926747180 bytes in size and contains 115385 samples. The download size of the dataset is 2683147134 bytes.
提供机构:
timpal0l
原始信息汇总
数据集概述
数据集基本信息
- 名称: jupiter
- 别名: timpal0l/jupiter
- 描述: timpal0l/jupiter 数据集托管在 HF Mirror 上,由 HF Datasets 社区贡献。
- 创建者: Tim Isbister
- 网址: https://hf-mirror.com/datasets/timpal0l/jupiter
数据集详细信息
- 关键词:
- 100K - 1M
- parquet
- Datasets
- Dask
- Croissant
- 🇺🇸 Region: US
- 数据格式:
- repo:
- 描述: HF Mirror git 仓库。
- 内容链接: https://hf-mirror.com/datasets/timpal0l/jupiter/tree/refs%2Fconvert%2Fparquet
- 编码格式: git+https
- sha256: https://github.com/mlcommons/croissant/issues/80
- parquet-files-for-config-default:
- 描述: 由 HF Mirror 转换的基础 Parquet 文件(参见: https://hf-mirror.com/docs/datasets-server/parquet)。
- 包含在: repo
- 编码格式: application/x-parquet
- 包含文件: default//.parquet
- repo:
数据集子集
- default:
- 描述: timpal0l/jupiter - default 子集
- 附加信息:
- 4 个跳过的列: input_ids, token_type_ids, attention_mask, labels



