Noise144/ticket_classification_IT_EN
收藏Hugging Face2024-03-28 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/Noise144/ticket_classification_IT_EN
下载链接
链接失效反馈官方服务:
资源简介:
该数据集用于微调xlm-roberta-base模型进行IT工单分类,包含1800条工单文本,分为18个类别,涵盖了数据库、硬件、咨询/帮助、网络和软件等宏类别。数据集中的文本由GPT 3.5-turbo生成,不包含敏感数据,每个类别有100个示例,其中50个为意大利语,50个为英语。
该数据集用于微调xlm-roberta-base模型进行IT工单分类,包含1800条工单文本,分为18个类别,涵盖了数据库、硬件、咨询/帮助、网络和软件等宏类别。数据集中的文本由GPT 3.5-turbo生成,不包含敏感数据,每个类别有100个示例,其中50个为意大利语,50个为英语。
提供机构:
Noise144
原始信息汇总
数据集概述
基本信息
- 任务类别:
- 文本分类
- 填充掩码
- 特征提取
- 句子相似度
- 语言:
- 意大利语
- 英语
- 标签:
- 分类
- 文本
- 工单
- 意大利工单
- 意大利语
- 英语
- 数据集大小:小于1000条
数据集详情
- 用途:用于微调xlm-roberta-base模型进行意大利语和英语工单分类。
- 数据量:包含1800条工单文本。
- 分类:包含18个类别,分布如下:
- 数据库:3个类别
- 硬件:6个类别
- 咨询/帮助:2个类别
- 网络:5个类别
- 软件:2个类别
- 数据生成:使用GPT 3.5-turbo生成,每个类别100个示例,其中50个意大利语,50个英语,不包含敏感数据。



