five

yzhuang/autotree_automl_Diabetes130US_gosdt_l512_d3_sd1

收藏
Hugging Face2023-08-30 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/yzhuang/autotree_automl_Diabetes130US_gosdt_l512_d3_sd1
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: id dtype: int64 - name: input_x sequence: sequence: int64 - name: input_y sequence: sequence: float32 - name: rtg sequence: float64 - name: status sequence: sequence: float32 - name: split_threshold sequence: sequence: int64 - name: split_dimension sequence: int64 splits: - name: train num_bytes: 5538400000 num_examples: 100000 - name: validation num_bytes: 553840000 num_examples: 10000 download_size: 487895484 dataset_size: 6092240000 --- # Dataset Card for "autotree_automl_Diabetes130US_gosdt_l512_d3_sd1" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)

数据集信息: 特征集: - 名称:id 数据类型:64位整型(int64) - 名称:input_x 数据类型:二维嵌套序列,元素类型为64位整型(int64) - 名称:input_y 数据类型:二维嵌套序列,元素类型为32位浮点型(float32) - 名称:rtg 数据类型:序列,元素类型为64位浮点型(float64) - 名称:status 数据类型:二维嵌套序列,元素类型为32位浮点型(float32) - 名称:split_threshold 数据类型:二维嵌套序列,元素类型为64位整型(int64) - 名称:split_dimension 数据类型:序列,元素类型为64位整型(int64) 数据集划分: - 划分名称:训练集(train) 字节占用量:5538400000 样本总数:100000 - 划分名称:验证集(validation) 字节占用量:553840000 样本总数:10000 下载总大小:487895484 数据集总存储大小:6092240000 --- # 数据集卡片:“autotree_automl_Diabetes130US_gosdt_l512_d3_sd1” [需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
yzhuang
原始信息汇总

数据集概述

特征信息

  • id: 数据类型为 int64
  • input_x: 序列类型,数据类型为 int64
  • input_y: 序列类型,数据类型为 float32
  • rtg: 序列类型,数据类型为 float64
  • status: 序列类型,数据类型为 float32
  • split_threshold: 序列类型,数据类型为 int64
  • split_dimension: 数据类型为 int64

数据分割

  • train: 包含 100000 个样本,占用 5538400000 字节
  • validation: 包含 10000 个样本,占用 553840000 字节

数据集大小

  • 下载大小: 487895484 字节
  • 数据集大小: 6092240000 字节
二维码
社区交流群
二维码
科研交流群
商业服务