growth-cadet/Newmod_signals-deparment_split-newv1v2v3-574
收藏Hugging Face2024-06-17 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/growth-cadet/Newmod_signals-deparment_split-newv1v2v3-574
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个字段,主要用于分析和处理结构化数据。字段包括uuid、ats_id、ats、context等,每个字段都有其特定的数据类型。特别值得注意的是,gpt-4-turbo_response字段是一个结构化字段,包含多个子字段,如deparment、department、focus_areas等,这些子字段进一步包含更详细的信息。数据集分为训练集(train),包含574个样本。
该数据集包含多个字段,主要用于分析和处理结构化数据。字段包括uuid、ats_id、ats、context等,每个字段都有其特定的数据类型。特别值得注意的是,gpt-4-turbo_response字段是一个结构化字段,包含多个子字段,如deparment、department、focus_areas等,这些子字段进一步包含更详细的信息。数据集分为训练集(train),包含574个样本。
提供机构:
growth-cadet
原始信息汇总
数据集概述
数据集信息
特征
- uuid: 字符串类型
- ats_id: 字符串类型
- ats: 字符串类型
- context: 字符串类型
- cleaned_context: 字符串类型
- token_size: 64位整数类型
- index_level_0: 64位整数类型
- bs4_text: 字符串类型
- gpt-4-turbo_raw_output: 字符串类型
- gpt-4-turbo_response: 结构体类型
- deparment: 结构体类型
- inferred: 布尔类型
- jobrole_department: 字符串类型
- department: 结构体类型
- inferred: 布尔类型
- team: 字符串类型
- toplevel_department: 字符串类型
- focus_areas: 列表类型
- description: 字符串类型
- subject: 字符串类型
- industries: 列表类型
- description: 字符串类型
- subject: 字符串类型
- products_and_technologies: 列表类型
- description: 字符串类型
- subject: 字符串类型
- deparment: 结构体类型
- gpt-4-turbo_cost: 64位浮点数类型
- prompt: 字符串类型
- raw_output: 字符串类型
- department: 字符串类型
- mod_dep_raw: 字符串类型
- mod_answer: 字符串类型
- mod_p&t_mod_answer_raw: 字符串类型
- new_p&t_answer: 字符串类型
- prompt_0: 字符串类型
数据分割
- train: 包含574个样本,占用95818878字节
数据集大小
- 下载大小: 35432564字节
- 数据集大小: 95818878字节
配置
- default:
- 数据文件:
- train: 路径为
data/train-*
- train: 路径为
- 数据文件:



