2024-mcm-everitt-ryan/job-postings-raw
收藏Hugging Face2024-05-25 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/2024-mcm-everitt-ryan/job-postings-raw
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: document_id
dtype: string
- name: country
dtype: string
- name: locale
dtype: string
- name: language
dtype: string
- name: detected_language
dtype: string
- name: detected_language_confidence
dtype: float64
- name: source
dtype: string
- name: scraped_date
dtype: int64
- name: company_id
dtype: string
- name: companyName
dtype: string
- name: city
dtype: string
- name: dataset_id
dtype: string
- name: dataset_type
dtype: string
- name: dataset_license
dtype: string
- name: dataset_source
dtype: string
- name: dataset_title
dtype: string
- name: dataset_url
dtype: string
- name: category
dtype: string
- name: position_name
dtype: string
- name: job_posting_html
dtype: string
splits:
- name: train
num_bytes: 10022868302
num_examples: 2597092
download_size: 3564732296
dataset_size: 10022868302
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
提供机构:
2024-mcm-everitt-ryan
原始信息汇总
数据集概述
数据集特征
- document_id: 字符串类型
- country: 字符串类型
- locale: 字符串类型
- language: 字符串类型
- detected_language: 字符串类型
- detected_language_confidence: 浮点数类型
- source: 字符串类型
- scraped_date: 整数类型
- company_id: 字符串类型
- companyName: 字符串类型
- city: 字符串类型
- dataset_id: 字符串类型
- dataset_type: 字符串类型
- dataset_license: 字符串类型
- dataset_source: 字符串类型
- dataset_title: 字符串类型
- dataset_url: 字符串类型
- category: 字符串类型
- position_name: 字符串类型
- job_posting_html: 字符串类型
数据集分割
- train:
- 数据量: 10022868302 字节
- 示例数量: 2597092
数据集大小
- 下载大小: 3564732296 字节
- 数据集总大小: 10022868302 字节



