five

Noise144/ticket_classification_IT_EN

收藏
Hugging Face2024-03-28 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/Noise144/ticket_classification_IT_EN
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集用于微调xlm-roberta-base模型进行IT工单分类,包含1800条工单文本,分为18个类别,涵盖了数据库、硬件、咨询/帮助、网络和软件等宏类别。数据集中的文本由GPT 3.5-turbo生成,不包含敏感数据,每个类别有100个示例,其中50个为意大利语,50个为英语。

该数据集用于微调xlm-roberta-base模型进行IT工单分类,包含1800条工单文本,分为18个类别,涵盖了数据库、硬件、咨询/帮助、网络和软件等宏类别。数据集中的文本由GPT 3.5-turbo生成,不包含敏感数据,每个类别有100个示例,其中50个为意大利语,50个为英语。
提供机构:
Noise144
原始信息汇总

数据集概述

基本信息

  • 任务类别
    • 文本分类
    • 填充掩码
    • 特征提取
    • 句子相似度
  • 语言
    • 意大利语
    • 英语
  • 标签
    • 分类
    • 文本
    • 工单
    • 意大利工单
    • 意大利语
    • 英语
  • 数据集大小:小于1000条

数据集详情

  • 用途:用于微调xlm-roberta-base模型进行意大利语和英语工单分类。
  • 数据量:包含1800条工单文本。
  • 分类:包含18个类别,分布如下:
    • 数据库:3个类别
    • 硬件:6个类别
    • 咨询/帮助:2个类别
    • 网络:5个类别
    • 软件:2个类别
  • 数据生成:使用GPT 3.5-turbo生成,每个类别100个示例,其中50个意大利语,50个英语,不包含敏感数据。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作