five

sophie127/test1

收藏
Hugging Face2024-06-16 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/sophie127/test1
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多个特征字段,涉及图像、ID、源代码、仪表板中的图表数量、种子数据名称、种子数据统计、祖先ID、来源、来源步骤类型、来源步骤成本、成本、修订步骤、修订步骤功能、父源代码、父ID、一致性标志以及多个与图表相关的字段。数据集分为训练集,包含10932个示例,总大小为7479407472.416字节。

This dataset includes multiple feature fields related to images, IDs, source code, the number of charts in a dashboard, seed data name, seed data statistics, ancestor IDs, provenance, provenance step types, provenance step costs, cost, revision step, revision step function, parent source code, parent ID, consistency flag, and several fields related to charts. The dataset is divided into a training set containing 10932 examples with a total size of 7479407472.416 bytes.
提供机构:
sophie127
原始信息汇总

数据集概述

数据集特征

  • image: 图像数据
  • id: 字符串类型,标识符
  • source_code: 字符串类型,源代码
  • number_of_charts_in_dashboard: 字符串类型,仪表板中的图表数量
  • seed_data_name: 字符串类型,种子数据名称
  • seed_data_stats: 字符串类型,种子数据统计信息
  • ancestor_ids: 字符串类型,祖先标识符
  • provenance: 字符串类型,数据来源
  • provenance_step_types: 字符串类型,数据来源步骤类型
  • provenance_step_costs: 字符串类型,数据来源步骤成本
  • cost: 字符串类型,成本
  • revision_step: 字符串类型,修订步骤
  • revision_step_function: 字符串类型,修订步骤函数
  • parent_source_code: 字符串类型,父源代码
  • parent_id: 字符串类型,父标识符
  • is_consistent: 字符串类型,是否一致
  • CHANNEL_FIELD_SWAP: 字符串类型,通道字段交换
  • CHANNEL_FIELD_SHIFT: 字符串类型,通道字段移位
  • XY_SAME_QUANTITATIVE: 字符串类型,XY相同定量
  • XY_SAME_NOMINAL: 字符串类型,XY相同名义
  • XY_MEASURE_NAMES: 字符串类型,XY测量名称
  • COLOR_SAME_QUANTITATIVE: 字符串类型,颜色相同定量
  • COLOR_DIFF_QUANTITATIVE: 字符串类型,颜色不同定量
  • COLOR_SAME_NOMINAL: 字符串类型,颜色相同名义
  • COLOR_DIFF_NOMINAL: 字符串类型,颜色不同名义
  • COLOR_NOMINAL_VS_QUANTITATIVE: 字符串类型,颜色名义与定量对比
  • COLOR_CONSTANT_VS_NOMINAL: 字符串类型,颜色常量与名义对比
  • COLOR_CONSTANT_VS_QUANTITATIVE: 字符串类型,颜色常量与定量对比
  • SIZE_SAME_QUANTITATIVE: 字符串类型,大小相同定量
  • SIZE_NO_DIFF: 字符串类型,大小无差异
  • SHAPE_SAME_NOMINAL: 字符串类型,形状相同名义
  • SHAPE_DIFF_NOMINAL: 字符串类型,形状不同名义
  • SHAPE_CONSTANT: 字符串类型,形状常量
  • source_code_vg: 字符串类型,源代码可视化
  • train_val_test: 字符串类型,训练验证测试

数据集分割

  • train: 训练集,包含10932个样本,大小为7479407472.416字节

数据集大小

  • 下载大小: 3044436756字节
  • 数据集大小: 7479407472.416字节

配置

  • config_name: default
    • data_files:
      • split: train
      • path: data/train-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作