five

Williamcoelho/database-small-tabular-regression4

收藏
Hugging Face2024-07-10 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/Williamcoelho/database-small-tabular-regression4
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含与职位和候选人相关的信息,涵盖了职位名称、职位级别、职位所在城市、州和国家、最低工作经验要求、最低教育水平要求、薪资范围、合同类型、语言要求、候选人最近的工作经历、教育背景、工作经验时长、所在城市、州和国家、语言水平等信息。数据集分为训练集和验证集,分别包含160和40个样本。

This dataset contains detailed information about job positions and candidates, including job ID, level, location, experience requirements, educational background, salary range, contract type, language skills, etc. The dataset is divided into training and validation sets for model training and validation.
提供机构:
Williamcoelho
原始信息汇总

数据集概述

数据集特征

  • id: 整数类型
  • cargo_da_vaga: 字符串类型
  • nivel_da_vaga: 整数类型
  • cidade_da_vaga: 字符串类型
  • estado_da_vaga: 字符串类型
  • pais_da_vaga: 整数类型
  • minimo_experiencia_meses_vaga: 整数类型
  • minimo_nivel_educacao_vaga: 整数类型
  • remuneracao_minima: 整数类型
  • remuneracao_maxima: 整数类型
  • tipo_contrato: 整数类型
  • idioma_obrigatorio_en: 整数类型
  • idioma_obrigatorio_es: 整数类型
  • idioma_obrigatorio_pt: 整数类型
  • idioma_desejavel_en: 整数类型
  • idioma_desejavel_es: 整数类型
  • idioma_desejavel_pt: 整数类型
  • ultimo_cargo: 字符串类型
  • ultimo_empresa: 字符串类型
  • ultimo_data_incio: 字符串类型
  • ultimo_periodo_meses: 整数类型
  • ultimo_nivel: 整数类型
  • penultimo_cargo: 字符串类型
  • penultimo_empresa: 字符串类型
  • penultimo_data_inicio: 字符串类型
  • penultimo_periodo_meses: 整数类型
  • penultimo_nivel: 整数类型
  • antipoenultimo_cargo: 字符串类型
  • antipoenultimo_empresa: 字符串类型
  • antipoenultimo_data_inicio: 字符串类型
  • antipoenultimo_periodo_meses: 整数类型
  • antipoenultimo_nivel: 整数类型
  • ultimo_educacao_tecnico_name: 字符串类型
  • ultimo_educacao_tecnico_institution: 字符串类型
  • ultimo_educacao_tecnologo_name: 字符串类型
  • ultimo_educacao_tecnologo_institution: 字符串类型
  • ultimo_educacao_graduacao_name: 字符串类型
  • ultimo_educacao_graduacao_institution: 字符串类型
  • ultimo_educacao_pos_graduacao_mba_name: 字符串类型
  • ultimo_educacao_pos_graduacao_mba_institution: 字符串类型
  • ultimo_educacao_mestrado_name: 字符串类型
  • ultimo_educacao_mestrado_institution: 字符串类型
  • ultimo_educacao_doutorado_name: 字符串类型
  • ultimo_educacao_doutorado_institution: 字符串类型
  • data_inicio_primeira_empresa: 字符串类型
  • quantidade_experiencias_profissionais: 整数类型
  • quantidade_anos_experiencia: 整数类型
  • tempo_medio_por_empresa_meses: 整数类型
  • quantidade_de_cursos: 整数类型
  • tempo_meses_cargo_aderente: 整数类型
  • cidade_da_candidato: 字符串类型
  • estado_da_candidato: 字符串类型
  • pais_da_candidato: 整数类型
  • nivel_idioma_en: 整数类型
  • nivel_idioma_es: 整数类型
  • nivel_idioma_pt: 整数类型
  • target: 浮点数类型

数据集分割

  • train: 包含160个样本,占用134638.4字节
  • valid: 包含40个样本,占用33659.6字节

数据集大小

  • 下载大小: 91852字节
  • 数据集总大小: 168298.0字节

配置

  • config_name: default
    • data_files:
      • train: data/train-*
      • valid: data/valid-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作