growth-cadet/Newmod_signals-deparment_split-newv1v2v3-574eval
收藏Hugging Face2024-06-17 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/growth-cadet/Newmod_signals-deparment_split-newv1v2v3-574eval
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个特征,如uuid、ats_id、context等,这些特征涵盖了文本数据、结构化数据以及一些处理后的输出。数据集主要用于存储和处理与文本相关的信息,特别是通过GPT-4模型生成的响应和成本数据。数据集包含一个训练集,大小为95828062字节,包含574个示例。
该数据集包含多个特征,如uuid、ats_id、context等,这些特征涵盖了文本数据、结构化数据以及一些处理后的输出。数据集主要用于存储和处理与文本相关的信息,特别是通过GPT-4模型生成的响应和成本数据。数据集包含一个训练集,大小为95828062字节,包含574个示例。
提供机构:
growth-cadet
原始信息汇总
数据集概述
数据集信息
- 特征列表:
uuid: 字符串类型ats_id: 字符串类型ats: 字符串类型context: 字符串类型cleaned_context: 字符串类型token_size: 64位整数类型__index_level_0__: 64位整数类型bs4_text: 字符串类型gpt-4-turbo_raw_output: 字符串类型gpt-4-turbo_response: 结构体类型deparment: 结构体类型inferred: 布尔类型jobrole_department: 字符串类型
department: 结构体类型inferred: 布尔类型team: 字符串类型toplevel_department: 字符串类型
focus_areas: 列表类型description: 字符串类型subject: 字符串类型
industries: 列表类型description: 字符串类型subject: 字符串类型
products_and_technologies: 列表类型description: 字符串类型subject: 字符串类型
gpt-4-turbo_cost: 64位浮点数类型prompt: 字符串类型raw_output: 字符串类型department: 字符串类型mod_dep_raw: 字符串类型mod_answer: 字符串类型mod_p&t_mod_answer_raw: 字符串类型new_p&t_answer: 字符串类型prompt_0: 字符串类型pass_pydantic: 64位整数类型pass_eval_embedd: 64位整数类型
数据集分割
- 训练集:
- 样本数量: 574
- 数据大小: 95828062 字节
数据集大小
- 下载大小: 35433827 字节
- 数据集总大小: 95828062 字节
配置信息
- 配置名称: default
- 数据文件路径: data/train-*



