five

English UK Call Center Transcripts - 1M Words

收藏
Snowflake2026-03-23 更新2026-03-27 收录
下载链接:
https://app.snowflake.com/marketplace/listing/GZSYZVBO55
下载链接
链接失效反馈
官方服务:
资源简介:
**Dataset Overview** Nearly 1M words (5.3M Chars) of high-quality, human-validated English (UK) agent–customer conversations captured from real-world, multi-domain call center interactions. The dataset reflects authentic customer service dialogue across industries, featuring natural speech patterns, real problem-solving flows, emotional variability, and domain-specific language that cannot be replicated through synthetic or scripted data. It is specifically designed for training and fine-tuning large language models, conversational agents, and enterprise automation solutions. **Our datasets include:** - Structured multi-turn dialogues - Speaker-separated conversations (agent and customer) - Domain-specific business interactions - Cleaned and normalized text for direct model ingestion - Compliance-ready data sourcing **Key AI use cases** - LLM fine-tuning for customer support copilots - Conversational AI and voice/chat agents - Automated ticket classification and routing - Sentiment and churn prediction models - Compliance monitoring and quality assurance automation This is a free, content-limited trial. For access to the full dataset, please reach out to our team.
提供机构:
DATAmundi
创建时间:
2025-12-15
原始信息汇总

English UK Call Center Transcripts - 1M Words 数据集概述

数据集基本信息

  • 数据集名称: English UK Call Center Transcripts - 1M Words
  • 提供商: DATAmundi
  • 访问模式: 免费试用(内容受限)
  • 数据状态: 静态数据产品

数据集内容与规模

  • 包含近100万个单词(530万个字符)的高质量、经过人工验证的英语(英国)客服人员与客户对话。
  • 数据源自真实世界、多领域的呼叫中心互动记录。
  • 包含跨行业的真实客户服务对话,具有自然语音模式、真实问题解决流程、情感变化以及领域特定语言。

数据集特点

  • 包含结构化多轮对话。
  • 对话按说话者分离(客服人员和客户)。
  • 包含特定领域的业务互动。
  • 文本经过清理和标准化,可直接供模型使用。
  • 数据来源符合合规要求。

主要AI应用场景

  • 用于客户支持副驾驶的大型语言模型微调。
  • 对话式AI及语音/聊天代理。
  • 自动工单分类和路由。
  • 情感分析和客户流失预测模型。
  • 合规监控和质量保证自动化。

数据字典(表:EN_UK_CALL_CENTRE_TRANSCRIPTIONS)

列说明:

  • CONTENT: Varchar
  • LANGUAGE: Varchar
  • LOUDNESSLEVEL: Varchar
  • PRIMARYTYPE: Varchar
  • SEGMENTID: Varchar
  • SPEAKERID: Varchar
  • SEGMENTLANGUAGES: Varchar
  • TRANSCRIPT_DOMAIN: Varchar
  • TRANSCRIPT_ID: Varchar
  • TRANSCRIPT_LANGUAGES: Varchar
  • TRANSCRIPT_NAME: Varchar
  • TRANSCRIPT_TOPIC: Varchar
  • START_T: Float
  • END_T: Float

数据预览示例:

  • 语言均为 en_GB
  • 响度级别均为 Normal
  • 主要类型均为 Speech
  • 转录领域均为 Call-center
  • 转录名称均为 MULTI_SPEAKER_LONG_FORM_TRANSCRIPTION
  • 转录主题示例包括 OthersWork

使用示例

获取所有转录数据: sql Select * from EN_UK_CALL_CENTRE_TRANSCRIPTIONS

云区域可用性

  • AWS: 非洲(开普敦)、亚太(雅加达)、亚太(孟买)、亚太(大阪)等49个以上区域。

提供商信息

  • 销售联系: sales@datamundi.ai
  • 支持联系: https://datamundi.ai/contact/

法律条款

  • 标准条款。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作