edanigoben/fr-crawle-reduced
收藏Hugging Face2023-05-16 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/edanigoben/fr-crawle-reduced
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含文本和标签两个特征,标签为分类标签,包括业务分析师、数据分析师、数据工程师、全栈工程师、数据科学家、软件工程师、DevOps工程师、前端工程师、商业智能分析师和机器学习工程师等类别。数据集分为训练集、验证集和测试集,训练集包含80000个样本,验证集和测试集各包含10000个样本。
该数据集包含文本和标签两个特征,标签为分类标签,包括业务分析师、数据分析师、数据工程师、全栈工程师、数据科学家、软件工程师、DevOps工程师、前端工程师、商业智能分析师和机器学习工程师等类别。数据集分为训练集、验证集和测试集,训练集包含80000个样本,验证集和测试集各包含10000个样本。
提供机构:
edanigoben
原始信息汇总
数据集概述
特征
- 名称: labels
- 数据类型: 类别标签
- 类别名称:
- 0: business analyst
- 1: data analyst
- 2: data engineer
- 3: full stack
- 4: data scientist
- 5: software engineer
- 6: devops engineer
- 7: front end
- 8: business intelligence analyst
- 9: machine learning engineer
- 名称: text
- 数据类型: 字符串
数据分割
- 训练集
- 字节数: 13994632.751735482
- 样本数: 80000
- 验证集
- 字节数: 1749329.0939669353
- 样本数: 10000
- 测试集
- 字节数: 1749329.0939669353
- 样本数: 10000
数据集大小
- 下载大小: 10098323
- 数据集大小: 17493290.939669352



