five

Vinno97/customer-service-intent-mining-hackathon

收藏
Hugging Face2024-06-21 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/Vinno97/customer-service-intent-mining-hackathon
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个用于文本分类和零样本分类任务的英文数据集,包含1944个训练样本。数据集的特征包括消息文本、标签以及多种维度的嵌入向量(如2D、3D、128D、256D和512D)。数据集基于`jonathansuru/customer_service_intent_detection`,并新增了使用`BAAI/bge-large-en-v1.5`模型生成的`prompt_embedding`列。

该数据集是一个用于文本分类和零样本分类任务的英文数据集,包含1944个训练样本。数据集的特征包括消息文本、标签以及多种维度的嵌入向量(如2D、3D、128D、256D和512D)。数据集基于`jonathansuru/customer_service_intent_detection`,并新增了使用`BAAI/bge-large-en-v1.5`模型生成的`prompt_embedding`列。
提供机构:
Vinno97
原始信息汇总

数据集概述

基本信息

  • 语言: 英语
  • 许可证: Apache 2.0
  • 数据集大小: 1K<n<10K
  • 任务类别:
    • 文本分类
    • 零样本分类
  • 数据集名称: adsf

数据集结构

特征

  • message: 字符串类型
  • label: 字符串类型
  • embedding: 浮点数序列,类型为float64
  • embedding_2d: 浮点数序列,类型为float32
  • embedding_3d: 浮点数序列,类型为float32
  • embedding_128d: 浮点数序列,类型为float32
  • embedding_256d: 浮点数序列,类型为float32
  • embedding_512d: 浮点数序列,类型为float32

数据分割

  • train:
    • 样本数量: 1944
    • 字节数: 23107641

文件信息

  • 下载大小: 13886200
  • 数据集大小: 23107641

配置

  • config_name: default
    • data_files:
      • split: train
      • path: data/train-*

数据集来源

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作