English UK Call Center Transcripts - 1M Words
收藏Snowflake2026-03-23 更新2026-03-27 收录
下载链接:
https://app.snowflake.com/marketplace/listing/GZSYZVBO55
下载链接
链接失效反馈官方服务:
资源简介:
**Dataset Overview**
Nearly 1M words (5.3M Chars) of high-quality, human-validated English (UK) agent–customer conversations captured from real-world, multi-domain call center interactions. The dataset reflects authentic customer service dialogue across industries, featuring natural speech patterns, real problem-solving flows, emotional variability, and domain-specific language that cannot be replicated through synthetic or scripted data.
It is specifically designed for training and fine-tuning large language models, conversational agents, and enterprise automation solutions.
**Our datasets include:**
- Structured multi-turn dialogues
- Speaker-separated conversations (agent and customer)
- Domain-specific business interactions
- Cleaned and normalized text for direct model ingestion
- Compliance-ready data sourcing
**Key AI use cases**
- LLM fine-tuning for customer support copilots
- Conversational AI and voice/chat agents
- Automated ticket classification and routing
- Sentiment and churn prediction models
- Compliance monitoring and quality assurance automation
This is a free, content-limited trial. For access to the full dataset, please reach out to our team.
提供机构:
DATAmundi
创建时间:
2025-12-15
原始信息汇总
English UK Call Center Transcripts - 1M Words 数据集概述
数据集基本信息
- 数据集名称: English UK Call Center Transcripts - 1M Words
- 提供商: DATAmundi
- 访问模式: 免费试用(内容受限)
- 数据状态: 静态数据产品
数据集内容与规模
- 包含近100万个单词(530万个字符)的高质量、经过人工验证的英语(英国)客服人员与客户对话。
- 数据源自真实世界、多领域的呼叫中心互动记录。
- 包含跨行业的真实客户服务对话,具有自然语音模式、真实问题解决流程、情感变化以及领域特定语言。
数据集特点
- 包含结构化多轮对话。
- 对话按说话者分离(客服人员和客户)。
- 包含特定领域的业务互动。
- 文本经过清理和标准化,可直接供模型使用。
- 数据来源符合合规要求。
主要AI应用场景
- 用于客户支持副驾驶的大型语言模型微调。
- 对话式AI及语音/聊天代理。
- 自动工单分类和路由。
- 情感分析和客户流失预测模型。
- 合规监控和质量保证自动化。
数据字典(表:EN_UK_CALL_CENTRE_TRANSCRIPTIONS)
列说明:
CONTENT: VarcharLANGUAGE: VarcharLOUDNESSLEVEL: VarcharPRIMARYTYPE: VarcharSEGMENTID: VarcharSPEAKERID: VarcharSEGMENTLANGUAGES: VarcharTRANSCRIPT_DOMAIN: VarcharTRANSCRIPT_ID: VarcharTRANSCRIPT_LANGUAGES: VarcharTRANSCRIPT_NAME: VarcharTRANSCRIPT_TOPIC: VarcharSTART_T: FloatEND_T: Float
数据预览示例:
- 语言均为
en_GB。 - 响度级别均为
Normal。 - 主要类型均为
Speech。 - 转录领域均为
Call-center。 - 转录名称均为
MULTI_SPEAKER_LONG_FORM_TRANSCRIPTION。 - 转录主题示例包括
Others和Work。
使用示例
获取所有转录数据: sql Select * from EN_UK_CALL_CENTRE_TRANSCRIPTIONS
云区域可用性
- AWS: 非洲(开普敦)、亚太(雅加达)、亚太(孟买)、亚太(大阪)等49个以上区域。
提供商信息
- 销售联系: sales@datamundi.ai
- 支持联系: https://datamundi.ai/contact/
法律条款
- 标准条款。



