logistics-cx-transcript-analysis-chatml

Hugging Face2026-03-28 更新2026-03-29 收录

下载链接：

https://huggingface.co/datasets/mangesh-ux/logistics-cx-transcript-analysis-chatml

下载链接

链接失效反馈

官方服务：

资源简介：

OmniCX Logistics CX 数据集是一个研究预览版数据集，旨在从多轮客服对话中结构化提取物流和客户体验（CX）信号。每个记录采用 ChatML 风格的消息格式，包含固定的系统指令、用户对话记录和助手生成的 JSON 负载（匹配 LogisticsCXMetrics 模式）。数据集包含三个主要部分：行为分析（意图、努力程度、情感轨迹等）、运营分析（异常诊断、根本原因分类等）和诊断推理（可审计的推理字段和路由建议）。数据集采用英语，规模较小（小于1K样本），适用于结构化信息提取、多标签分析提取和模式约束生成等任务。数据集通过合成生成，并经过严格的质量控制，包括格式验证、必填字段检查和可解析性检查。需要注意的是，该数据集存在分布不匹配风险，不适用于法律/合规决策或完全自主的客户裁决。

创建时间：

2026-03-28

原始信息汇总

OmniCX Logistics CX 数据集（研究预览版）

数据集概述

本数据集旨在从多轮支持对话中结构化提取物流和客户体验（CX）信号。每个记录使用ChatML风格的消息，包含固定的system指令、user对话文本以及符合LogisticsCXMetrics模式的assistant JSON负载。此版本为研究预览版，不应视为经过生产认证的基准。

项目仓库：https://github.com/mangesh-ux/OmniCX-Extractor

分类法摘要

LogisticsCXMetrics包含三个顶级组：

behavioral_analytics：意图、努力程度（1-5级CES类量表）、情绪轨迹、返工频率以及摩擦证据引述。
operational_analytics：异常诊断、受控的异常/根本原因类别、确定性布尔标志以及解决状态跟踪。
diagnostic_reasoning：可审计的推理字段（intent_reasoning、exception_reasoning、effort_reasoning）以及路由建议。

核心受控词汇表包括客户意图家族、返工频段（0、1、2+）、情绪轨迹（Improved、Worsened、Unchanged）以及根本原因家族。

支持的任务

从支持对话文本中结构化信息提取
多标签分析提取
模式约束生成

语言

英语（en）

数据集结构

数据实例

每一行是一个JSON对象： json { "messages": [ {"role": "system", "content": "You are a SOTA Logistics AI. Extract the exact logistics and CX metrics from the following transcript."}, {"role": "user", "content": "Agent: ... Customer: ..."}, {"role": "assistant", "content": "{"behavioral_analytics": {...}, "operational_analytics": {...}, "diagnostic_reasoning": {...}}"} ] }

模式亮点

助手JSON包含三个必需部分：

behavioral_analytics
operational_analytics
diagnostic_reasoning

字段定义和枚举在src/schema.py中实现。详细的分类法/量表参考：https://github.com/mangesh-ux/OmniCX-Extractor/blob/main/docs/taxonomy.md

数据划分

当前仓库构件包括：

训练JSONL文件位于data/processed/
评估JSONL文件位于data/eval/

对于Hugging Face发布，提供明确的划分文件：

train.jsonl
validation.jsonl（可选但推荐）
test.jsonl

数据集创建

源数据

本项目主要使用合成的物流支持对话以及通过受控提示和模式验证生成的合成标签。

本仓库中使用的合成生成模型：

对话文本生成：gpt-4o-mini（src/data_factory.py）
模式约束标签提取：gpt-4o-mini（src/extractor.py）

知识来源推导（重要）

输出结构和分类法源自docs/knowledge/中的精选参考材料，包括：

Transcript-Only CX Difficulty Score_ Standards, Methods, and a Rigorous MVP Design.pdf 深度研究文档（由ChatGPT生成），专注于仅基于对话文本的CX摩擦和努力信号，包括返工、升级线索、情绪波动、未解决的后续标记以及难度/努力程度估计的量表设计。
Logistics CX Data Schema Development.docx NotebookLM辅助的研究和设计工件，专注于物流意图分类法和模式构建，用于细化意图家族、枚举边界以及适合提取的字段定义。

助手JSON中的字段定义、枚举选择和诊断类别均基于这些源文档，并通过LogisticsCXMetrics验证（src/schema.py）强制执行。

标注过程

标签表示为针对LogisticsCXMetrics模式的结构化JSON，包含行为、操作和推理组件。

质量控制

JSONL完整性的格式验证
模式完整性的必需键检查
助手JSON内容可解析性检查
针对格式错误示例的迭代清理脚本

局限性

当前迭代版本数据集规模较小
与真实支持日志存在分布不匹配风险
严格的精确匹配评分可能低估语义正确的输出
未针对法律/合规决策进行校准

偏见、风险与安全性

合成生成可能编码来自提示模型的风格偏见
根本原因和努力程度标签可能反映量表偏见
输出应经过人工审查方可采取操作行动
不适用于自动拒绝/升级裁决

非适用用途

完全自主的客户裁决
无人工监督的法律/监管决策
索赔/支付决策自动化

许可

本卡片假设数据集构件采用CC-BY-4.0许可。请在以下两处确认并发布最终法律选择：

数据集仓库的许可证元数据
仓库的LICENSE文件

引用

bibtex @dataset{omnicx_logistics_cx_preview, title = {OmniCX Logistics CX Dataset (Research Preview)}, author = {Mangesh Gupta}, year = {2026}, publisher = {Hugging Face}, note = {Synthetic logistics CX extraction dataset} }

搜集汇总

数据集介绍

构建方式

在物流客户体验分析领域，该数据集通过合成生成与结构化标注相结合的方式构建。源数据采用GPT-4o-mini模型生成模拟的物流客服对话文本，随后利用同一模型在严格模式约束下，从对话中提取符合LogisticsCXMetrics模式的指标。整个构建过程以知识文档为基础，包括关于仅基于文本的客户体验摩擦信号的研究报告以及物流意图分类体系的设计文档，确保了数据在语义与结构上的双重规范性。

特点

本数据集的核心特征在于其高度结构化的输出模式与精细的领域分类体系。它采用ChatML消息格式，将多轮对话与一个包含行为分析、运营分析和诊断推理三大维度的标准化JSON输出精确对应。数据集内嵌了严谨的受控词汇表，如客户意图家族、再处理频次分段以及情感轨迹状态，为物流客服场景下的信息抽取任务提供了清晰、可审计的语义框架，特别适用于对输出格式有严格要求的约束性生成研究。

使用方法

该数据集主要用于支持从客服对话中抽取结构化信息的学术研究。研究者可将其用于训练或评估模型执行模式约束下的文本生成任务，例如，根据给定的系统指令和用户对话，生成符合预定模式的物流客户体验指标。典型的使用流程包括加载JSONL格式的训练与评估文件，依据项目代码库中的模式定义进行数据解析，进而开展结构化信息抽取或多标签分析等实验，旨在为构建自动化客户体验分析流程提供原型验证基础。

背景与挑战

背景概述

在客户体验（CX）与物流运营智能分析领域，高效解析多轮对话以提取结构化信号成为关键研究课题。OmniCX物流客户体验数据集由Mangesh Gupta等人于2026年构建，旨在从物流客服对话中系统性地提取行为分析、运营诊断与推理等多维度指标。该数据集采用ChatML格式，通过合成生成与模式约束，为研究界提供了探索结构化信息抽取与模式约束生成的基准资源，推动了对话式人工智能在专业垂直领域的应用发展。

当前挑战

该数据集致力于解决从非结构化物流客服对话中精准提取复杂、多标签分析指标的挑战，涉及意图识别、情感轨迹追踪与根因分类等细粒度任务。在构建过程中，面临合成数据与真实对话分布不匹配的风险，以及严格模式验证可能导致语义正确但格式不符的输出被低估的评估难题。此外，小规模数据迭代与生成模型潜在风格偏见，亦对模型的泛化能力与公平性提出了严格要求。

常用场景

经典使用场景

在物流与客户体验研究领域，该数据集为结构化信息提取任务提供了标准化的评估基准。其经典使用场景集中于从多轮客服对话中自动化抽取物流异常、客户意图及情感轨迹等关键信号。研究人员利用ChatML格式的对话记录，训练模型识别行为分析与运营诊断的复杂模式，从而验证自然语言处理技术在垂直领域的泛化能力。

实际应用

在实际应用层面，该数据集为物流企业的客户服务优化提供了分析工具原型。企业可基于其标注体系构建自动化监控系统，实时识别对话中的客户摩擦点与运营异常根因。这类系统能够辅助客服团队进行优先级路由与干预决策，从而提升服务效率与客户满意度，降低运营成本。

衍生相关工作

围绕该数据集衍生的经典工作主要集中于结构化提取模型的创新。例如，基于Schema约束的生成方法被用于提升标注一致性，而多任务学习框架则尝试联合优化行为与运营指标的预测。此外，部分研究利用其诊断推理字段开发可解释性模块，为对话分析系统的决策过程提供透明度。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集