jyansir/excelformer

Name: jyansir/excelformer
Creator: jyansir
Published: 2024-06-05 19:19:27
License: 暂无描述

Hugging Face2024-06-05 更新2024-06-12 收录

下载链接：

https://hf-mirror.com/datasets/jyansir/excelformer

下载链接

链接失效反馈

官方服务：

资源简介：

ExcelFormer Benchmark数据集用于ExcelFormer模型，包含small和large两种配置，每种配置下分为train、val和test三个分割。数据集以parquet文件格式存储，并提供了使用HuggingFace的datasets库加载和处理数据的示例代码。

提供机构：

jyansir

原始信息汇总

ExcelFormer Benchmark 数据集

数据集配置

small 配置：
- 训练集：train-small.parquet
- 验证集：val-small.parquet
- 测试集：test-small.parquet
- 默认配置
large 配置：
- 训练集：train-large.parquet
- 验证集：val-large.parquet
- 测试集：test-large.parquet

使用示例

python from datasets import load_dataset import pandas as pd import numpy as np

加载默认的 small-scale 数据集

datasets = load_dataset(jyansir/excelformer)

加载 large-scale 数据集

datasets = load_dataset(jyansir/excelformer, large)

dataset = datasets[train].to_dict() for table_name, table, task in zip(dataset[dataset_name], dataset[table], dataset[task]): data[table_name] = { X_num: None if not table[X_num] else pd.DataFrame.from_dict(table[X_num]), X_cat: None if not table[X_cat] else pd.DataFrame.from_dict(table[X_cat]), y: np.array(table[y]), y_info: table[y_info], task: task, }

搜集汇总

数据集介绍

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集