five

jyansir/excelformer

收藏
Hugging Face2024-06-05 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/jyansir/excelformer
下载链接
链接失效反馈
官方服务:
资源简介:
ExcelFormer Benchmark数据集用于ExcelFormer模型,包含small和large两种配置,每种配置下分为train、val和test三个分割。数据集以parquet文件格式存储,并提供了使用HuggingFace的datasets库加载和处理数据的示例代码。

ExcelFormer Benchmark数据集用于ExcelFormer模型,包含small和large两种配置,每种配置下分为train、val和test三个分割。数据集以parquet文件格式存储,并提供了使用HuggingFace的datasets库加载和处理数据的示例代码。
提供机构:
jyansir
原始信息汇总

ExcelFormer Benchmark 数据集

数据集配置

  • small 配置:

    • 训练集:train-small.parquet
    • 验证集:val-small.parquet
    • 测试集:test-small.parquet
    • 默认配置
  • large 配置:

    • 训练集:train-large.parquet
    • 验证集:val-large.parquet
    • 测试集:test-large.parquet

使用示例

python from datasets import load_dataset import pandas as pd import numpy as np

加载默认的 small-scale 数据集

datasets = load_dataset(jyansir/excelformer)

加载 large-scale 数据集

datasets = load_dataset(jyansir/excelformer, large)

dataset = datasets[train].to_dict() for table_name, table, task in zip(dataset[dataset_name], dataset[table], dataset[task]): data[table_name] = { X_num: None if not table[X_num] else pd.DataFrame.from_dict(table[X_num]), X_cat: None if not table[X_cat] else pd.DataFrame.from_dict(table[X_cat]), y: np.array(table[y]), y_info: table[y_info], task: task, }

搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作