Williamcoelho/database-small-tabular-regression4
收藏Hugging Face2024-07-10 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/Williamcoelho/database-small-tabular-regression4
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含与职位和候选人相关的信息,涵盖了职位名称、职位级别、职位所在城市、州和国家、最低工作经验要求、最低教育水平要求、薪资范围、合同类型、语言要求、候选人最近的工作经历、教育背景、工作经验时长、所在城市、州和国家、语言水平等信息。数据集分为训练集和验证集,分别包含160和40个样本。
This dataset contains detailed information about job positions and candidates, including job ID, level, location, experience requirements, educational background, salary range, contract type, language skills, etc. The dataset is divided into training and validation sets for model training and validation.
提供机构:
Williamcoelho
原始信息汇总
数据集概述
数据集特征
- id: 整数类型
- cargo_da_vaga: 字符串类型
- nivel_da_vaga: 整数类型
- cidade_da_vaga: 字符串类型
- estado_da_vaga: 字符串类型
- pais_da_vaga: 整数类型
- minimo_experiencia_meses_vaga: 整数类型
- minimo_nivel_educacao_vaga: 整数类型
- remuneracao_minima: 整数类型
- remuneracao_maxima: 整数类型
- tipo_contrato: 整数类型
- idioma_obrigatorio_en: 整数类型
- idioma_obrigatorio_es: 整数类型
- idioma_obrigatorio_pt: 整数类型
- idioma_desejavel_en: 整数类型
- idioma_desejavel_es: 整数类型
- idioma_desejavel_pt: 整数类型
- ultimo_cargo: 字符串类型
- ultimo_empresa: 字符串类型
- ultimo_data_incio: 字符串类型
- ultimo_periodo_meses: 整数类型
- ultimo_nivel: 整数类型
- penultimo_cargo: 字符串类型
- penultimo_empresa: 字符串类型
- penultimo_data_inicio: 字符串类型
- penultimo_periodo_meses: 整数类型
- penultimo_nivel: 整数类型
- antipoenultimo_cargo: 字符串类型
- antipoenultimo_empresa: 字符串类型
- antipoenultimo_data_inicio: 字符串类型
- antipoenultimo_periodo_meses: 整数类型
- antipoenultimo_nivel: 整数类型
- ultimo_educacao_tecnico_name: 字符串类型
- ultimo_educacao_tecnico_institution: 字符串类型
- ultimo_educacao_tecnologo_name: 字符串类型
- ultimo_educacao_tecnologo_institution: 字符串类型
- ultimo_educacao_graduacao_name: 字符串类型
- ultimo_educacao_graduacao_institution: 字符串类型
- ultimo_educacao_pos_graduacao_mba_name: 字符串类型
- ultimo_educacao_pos_graduacao_mba_institution: 字符串类型
- ultimo_educacao_mestrado_name: 字符串类型
- ultimo_educacao_mestrado_institution: 字符串类型
- ultimo_educacao_doutorado_name: 字符串类型
- ultimo_educacao_doutorado_institution: 字符串类型
- data_inicio_primeira_empresa: 字符串类型
- quantidade_experiencias_profissionais: 整数类型
- quantidade_anos_experiencia: 整数类型
- tempo_medio_por_empresa_meses: 整数类型
- quantidade_de_cursos: 整数类型
- tempo_meses_cargo_aderente: 整数类型
- cidade_da_candidato: 字符串类型
- estado_da_candidato: 字符串类型
- pais_da_candidato: 整数类型
- nivel_idioma_en: 整数类型
- nivel_idioma_es: 整数类型
- nivel_idioma_pt: 整数类型
- target: 浮点数类型
数据集分割
- train: 包含160个样本,占用134638.4字节
- valid: 包含40个样本,占用33659.6字节
数据集大小
- 下载大小: 91852字节
- 数据集总大小: 168298.0字节
配置
- config_name: default
- data_files:
- train: data/train-*
- valid: data/valid-*
- data_files:



