logistics-cx-transcript-analysis-chatml
收藏OmniCX Logistics CX 数据集(研究预览版)
数据集概述
本数据集旨在从多轮支持对话中结构化提取物流和客户体验(CX)信号。每个记录使用ChatML风格的消息,包含固定的system指令、user对话文本以及符合LogisticsCXMetrics模式的assistant JSON负载。此版本为研究预览版,不应视为经过生产认证的基准。
项目仓库:https://github.com/mangesh-ux/OmniCX-Extractor
分类法摘要
LogisticsCXMetrics包含三个顶级组:
behavioral_analytics:意图、努力程度(1-5级CES类量表)、情绪轨迹、返工频率以及摩擦证据引述。operational_analytics:异常诊断、受控的异常/根本原因类别、确定性布尔标志以及解决状态跟踪。diagnostic_reasoning:可审计的推理字段(intent_reasoning、exception_reasoning、effort_reasoning)以及路由建议。
核心受控词汇表包括客户意图家族、返工频段(0、1、2+)、情绪轨迹(Improved、Worsened、Unchanged)以及根本原因家族。
支持的任务
- 从支持对话文本中结构化信息提取
- 多标签分析提取
- 模式约束生成
语言
- 英语(
en)
数据集结构
数据实例
每一行是一个JSON对象: json { "messages": [ {"role": "system", "content": "You are a SOTA Logistics AI. Extract the exact logistics and CX metrics from the following transcript."}, {"role": "user", "content": "Agent: ... Customer: ..."}, {"role": "assistant", "content": "{"behavioral_analytics": {...}, "operational_analytics": {...}, "diagnostic_reasoning": {...}}"} ] }
模式亮点
助手JSON包含三个必需部分:
behavioral_analyticsoperational_analyticsdiagnostic_reasoning
字段定义和枚举在src/schema.py中实现。
详细的分类法/量表参考:https://github.com/mangesh-ux/OmniCX-Extractor/blob/main/docs/taxonomy.md
数据划分
当前仓库构件包括:
- 训练JSONL文件位于
data/processed/ - 评估JSONL文件位于
data/eval/
对于Hugging Face发布,提供明确的划分文件:
train.jsonlvalidation.jsonl(可选但推荐)test.jsonl
数据集创建
源数据
本项目主要使用合成的物流支持对话以及通过受控提示和模式验证生成的合成标签。
本仓库中使用的合成生成模型:
- 对话文本生成:
gpt-4o-mini(src/data_factory.py) - 模式约束标签提取:
gpt-4o-mini(src/extractor.py)
知识来源推导(重要)
输出结构和分类法源自docs/knowledge/中的精选参考材料,包括:
Transcript-Only CX Difficulty Score_ Standards, Methods, and a Rigorous MVP Design.pdf深度研究文档(由ChatGPT生成),专注于仅基于对话文本的CX摩擦和努力信号,包括返工、升级线索、情绪波动、未解决的后续标记以及难度/努力程度估计的量表设计。Logistics CX Data Schema Development.docxNotebookLM辅助的研究和设计工件,专注于物流意图分类法和模式构建,用于细化意图家族、枚举边界以及适合提取的字段定义。
助手JSON中的字段定义、枚举选择和诊断类别均基于这些源文档,并通过LogisticsCXMetrics验证(src/schema.py)强制执行。
标注过程
标签表示为针对LogisticsCXMetrics模式的结构化JSON,包含行为、操作和推理组件。
质量控制
- JSONL完整性的格式验证
- 模式完整性的必需键检查
- 助手JSON内容可解析性检查
- 针对格式错误示例的迭代清理脚本
局限性
- 当前迭代版本数据集规模较小
- 与真实支持日志存在分布不匹配风险
- 严格的精确匹配评分可能低估语义正确的输出
- 未针对法律/合规决策进行校准
偏见、风险与安全性
- 合成生成可能编码来自提示模型的风格偏见
- 根本原因和努力程度标签可能反映量表偏见
- 输出应经过人工审查方可采取操作行动
- 不适用于自动拒绝/升级裁决
推荐用途
- 模式约束提取的研究
- CX分析流程的原型设计
- 错误分析和模型行为研究
非适用用途
- 完全自主的客户裁决
- 无人工监督的法律/监管决策
- 索赔/支付决策自动化
许可
本卡片假设数据集构件采用CC-BY-4.0许可。请在以下两处确认并发布最终法律选择:
- 数据集仓库的许可证元数据
- 仓库的
LICENSE文件
引用
bibtex @dataset{omnicx_logistics_cx_preview, title = {OmniCX Logistics CX Dataset (Research Preview)}, author = {Mangesh Gupta}, year = {2026}, publisher = {Hugging Face}, note = {Synthetic logistics CX extraction dataset} }




