jyansir/excelformer
收藏Hugging Face2024-06-05 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/jyansir/excelformer
下载链接
链接失效反馈官方服务:
资源简介:
ExcelFormer Benchmark数据集用于ExcelFormer模型,包含small和large两种配置,每种配置下分为train、val和test三个分割。数据集以parquet文件格式存储,并提供了使用HuggingFace的datasets库加载和处理数据的示例代码。
ExcelFormer Benchmark数据集用于ExcelFormer模型,包含small和large两种配置,每种配置下分为train、val和test三个分割。数据集以parquet文件格式存储,并提供了使用HuggingFace的datasets库加载和处理数据的示例代码。
提供机构:
jyansir
原始信息汇总
ExcelFormer Benchmark 数据集
数据集配置
-
small 配置:
- 训练集:
train-small.parquet - 验证集:
val-small.parquet - 测试集:
test-small.parquet - 默认配置
- 训练集:
-
large 配置:
- 训练集:
train-large.parquet - 验证集:
val-large.parquet - 测试集:
test-large.parquet
- 训练集:
使用示例
python from datasets import load_dataset import pandas as pd import numpy as np
加载默认的 small-scale 数据集
datasets = load_dataset(jyansir/excelformer)
加载 large-scale 数据集
datasets = load_dataset(jyansir/excelformer, large)
dataset = datasets[train].to_dict() for table_name, table, task in zip(dataset[dataset_name], dataset[table], dataset[task]): data[table_name] = { X_num: None if not table[X_num] else pd.DataFrame.from_dict(table[X_num]), X_cat: None if not table[X_cat] else pd.DataFrame.from_dict(table[X_cat]), y: np.array(table[y]), y_info: table[y_info], task: task, }
搜集汇总
数据集介绍

以上内容由遇见数据集搜集并总结生成



