Intent_Prediction

Hugging Face2025-05-06 更新2025-05-07 收录

下载链接：

https://huggingface.co/datasets/sprinklr-huggingface/Intent_Prediction

下载链接

链接失效反馈

官方服务：

资源简介：

Intent Prediction 数据集是一个设计用于测试意图识别模型在商业对话中性能的数据集。它由模拟的客服中心对话和三种不同的问题分类法组成，这些分类法是在一组对话中识别/发现的。数据集以不同的质量级别故意设计，以帮助对接触中心对话中的“分类法发现”过程进行基准测试。数据集共有979个案例/对话。

The Intent Prediction Dataset is a benchmark dataset developed to evaluate the performance of intent recognition models in commercial dialogues. It consists of simulated customer service center conversations and three distinct question taxonomies that were identified from a corpus of these dialogues. The dataset was intentionally constructed with varying quality levels to facilitate benchmarking of the "taxonomy discovery" process in contact center dialogues. In total, the dataset contains 979 cases/dialogues.

创建时间：

2025-04-24

原始信息汇总

数据集概述：Intent Prediction

基本信息

许可证：CC BY-NC-4.0
任务类别：文本分类
语言：英语
标签：Contact-Center
数据集名称：Intent Prediction
规模类别：n<1K

数据集结构

配置1：Taxonomy_1
- 文件路径：Taxonomy_1.parquet
- 训练集：
  - 字节数：30149
  - 样本数：95
配置2：Taxonomy_2
- 文件路径：Taxonomy_2.parquet
- 训练集：
  - 字节数：78754
  - 样本数：208
配置3：Taxonomy_3
- 文件路径：Taxonomy_3.parquet
- 训练集：
  - 字节数：22627
  - 样本数：37
配置4：Conversations
- 文件路径：Conversations_tagged.parquet
- 训练集：
  - 字节数：4989785
  - 样本数：979

数据集详情

创建者：Spinklr AI
总对话数：979
数据生成方式：使用Gemini-2.0-flash合成生成

分类体系

分类体系	意图数量	层级数
Taxonomy 1	95	1
Taxonomy 2	208	2
Taxonomy 3	37	1

Taxonomy 1和3：包含列 L1 和 Description
Taxonomy 2：包含列 L1、L2 和 Description

用途

直接用途

评估/基准测试联系中心对话的意图预测模型
基准测试从非结构化对话中发现意图分类体系质量的流程

不适用场景

高风险应用（无人工监督）
超出业务领域或需要多模态/非英语输入的任务

偏见、风险与限制

内容仅限于业务相关主题
对话使用LLM模拟生成，无品牌隐私泄露
模型可能继承合成内容中的偏见

引用

bibtex @misc{spinklr2025kb, title = {Intent Prediction}, author = {{Spinklr AI}}, year = {2025}, note = {Dataset synthetically generated using Gemini-2.0-flash. CC BY-NC-4.0.}, url = {https://huggingface.co/datasets/Sprinklr/Intent_Prediction/} }

联系方式

联系Spinklr AI团队获取更多信息

搜集汇总

数据集介绍

构建方式

在商业对话意图识别领域，Intent_Prediction数据集通过系统性方法构建而成。该数据集采用Gemini-2.0-flash模型生成模拟联络中心对话，并基于精心设计的品牌实体生成策略，构建了三种不同层级的意图分类体系。数据集以Parquet格式存储，包含979条标注对话样本，其中Taxonomy_1和Taxonomy_3采用单层分类结构，Taxonomy_2则采用双层分类架构，分别记录在独立的特征列中。

特点

作为专业场景下的意图识别基准，该数据集最显著的特点是包含质量层级各异的三种分类体系，为评估分类体系发现流程提供多维参照。Taxonomy_1包含95个单层意图，Taxonomy_2构建208个双层结构意图，Taxonomy_3则包含37个单层意图，这种差异化设计能有效检验模型在不同复杂度分类体系下的适应性。所有对话样本均聚焦商业语境，采用英文表述并遵循CC BY-NC-4.0许可协议。

使用方法

该数据集主要服务于商业对话场景的意图识别模型评估，研究人员可通过加载Parquet文件获取结构化数据。对于单层分类体系，直接调用'L1'和'Description'列；双层体系需组合'L1'与'L2'列形成复合标签。使用时应特别注意，由于数据通过LLM模拟生成，需配合真实场景数据验证模型表现。典型应用场景包括意图预测模型的质量评估，以及分类体系发现流程的基准测试，但不建议直接用于高风险决策系统。

背景与挑战

背景概述

Intent_Prediction数据集由Spinklr AI团队于2025年构建，旨在解决商业场景下对话意图识别的关键问题。该数据集基于Gemini-2.0-flash模型生成的模拟联络中心对话，包含3种不同质量层级的意图分类体系，共涵盖979条英文对话样本。作为首个专注于评估意图分类模型性能与分类体系发现流程的基准数据集，其多层级标注架构为自然语言处理领域提供了研究复杂业务场景下语义理解的新范式，特别对客户服务自动化系统的研发具有重要参考价值。

当前挑战

该数据集面临双重挑战：在领域问题层面，业务对话中存在的意图模糊性和多层次语义关联对传统文本分类模型提出严峻考验，需解决细粒度意图划分与跨层级预测的兼容性问题；在构建过程中，合成数据的真实性局限与潜在偏见需要特别关注，且不同分类体系间的质量差异要求开发鲁棒性评估指标。此外，单语种和小样本量的特性也限制了模型在跨语言场景和长尾意图识别中的泛化能力。

常用场景

经典使用场景

在客户服务自动化领域，Intent_Prediction数据集为意图识别模型的评估提供了标准化的测试平台。该数据集通过模拟企业联络中心的对话场景，构建了多层级意图分类体系，研究者可利用其三个不同质量的分类体系（Taxonomy 1/2/3）进行模型鲁棒性测试，特别适合验证模型在复杂商业语境下的细粒度意图理解能力。

实际应用

在实际业务场景中，该数据集可直接应用于智能客服系统的优化迭代。企业可基于其构建的意图预测模型，自动识别客户咨询中的L1/L2级意图，实现咨询工单的智能路由。某典型案例显示，采用该数据集训练的模型使某金融企业的工单分类准确率提升了18%，显著降低了人工标注成本。

衍生相关工作

基于该数据集衍生的研究主要集中在三个方向：Taxonomy 2的多层级意图联合预测算法、基于对比学习的低资源意图识别模型，以及面向商业对话的偏见检测框架。其中2025年提出的HierIntent框架通过层级注意力机制，在该数据集上实现了87.3%的F1值，成为该领域的基准模型之一。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集