Vinno97/customer-service-intent-mining-hackathon
收藏Hugging Face2024-06-21 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/Vinno97/customer-service-intent-mining-hackathon
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个用于文本分类和零样本分类任务的英文数据集,包含1944个训练样本。数据集的特征包括消息文本、标签以及多种维度的嵌入向量(如2D、3D、128D、256D和512D)。数据集基于`jonathansuru/customer_service_intent_detection`,并新增了使用`BAAI/bge-large-en-v1.5`模型生成的`prompt_embedding`列。
该数据集是一个用于文本分类和零样本分类任务的英文数据集,包含1944个训练样本。数据集的特征包括消息文本、标签以及多种维度的嵌入向量(如2D、3D、128D、256D和512D)。数据集基于`jonathansuru/customer_service_intent_detection`,并新增了使用`BAAI/bge-large-en-v1.5`模型生成的`prompt_embedding`列。
提供机构:
Vinno97
原始信息汇总
数据集概述
基本信息
- 语言: 英语
- 许可证: Apache 2.0
- 数据集大小: 1K<n<10K
- 任务类别:
- 文本分类
- 零样本分类
- 数据集名称: adsf
数据集结构
特征
- message: 字符串类型
- label: 字符串类型
- embedding: 浮点数序列,类型为float64
- embedding_2d: 浮点数序列,类型为float32
- embedding_3d: 浮点数序列,类型为float32
- embedding_128d: 浮点数序列,类型为float32
- embedding_256d: 浮点数序列,类型为float32
- embedding_512d: 浮点数序列,类型为float32
数据分割
- train:
- 样本数量: 1944
- 字节数: 23107641
文件信息
- 下载大小: 13886200
- 数据集大小: 23107641
配置
- config_name: default
- data_files:
- split: train
- path: data/train-*
- data_files:
数据集来源
- 基于 jonathansuru/customer_service_intent_detection
- 添加了
prompt_embedding列,通过使用 BAAI/bge-large-en-v1.5 对 "message" 列进行嵌入处理



