five

English AU Call Center Human-Validated Transcripts - 570K words

收藏
Snowflake2026-03-23 更新2026-03-27 收录
下载链接:
https://app.snowflake.com/marketplace/listing/GZSYZVBO51
下载链接
链接失效反馈
官方服务:
资源简介:
**Dataset Overview** Nearly 570K words (3.1M Chars) of high-quality, human-validated English (AU) agent–customer conversations captured from real-world, multi-domain call center interactions. The dataset reflects authentic customer service dialogue across industries, featuring natural speech patterns, real problem-solving flows, emotional variability, and domain-specific language that cannot be replicated through synthetic or scripted data. It is specifically designed for training and fine-tuning large language models, conversational agents, and enterprise automation solutions. **Our datasets include:** - Structured multi-turn dialogues - Speaker-separated conversations (agent and customer) - Domain-specific business interactions - Cleaned and normalized text for direct model ingestion - Compliance-ready data sourcing **Key AI use cases** - LLM fine-tuning for customer support copilots - Conversational AI and voice/chat agents - Automated ticket classification and routing - Sentiment and churn prediction models - Compliance monitoring and quality assurance automation This is a free, content-limited trial. For access to the full dataset, please reach out to our team.
提供机构:
DATAmundi
创建时间:
2025-12-15
原始信息汇总

English AU Call Center Human-Validated Transcripts - 570K words

数据集概述

  • 包含近57万单词(310万字符)高质量、人工验证的英语(澳大利亚)客服人员与客户对话。
  • 数据源自真实世界、多领域的呼叫中心互动,反映了跨行业的真实客户服务对话。
  • 特征包括自然语音模式、真实问题解决流程、情感变化以及特定领域语言,无法通过合成或脚本数据复制。
  • 专为训练和微调大型语言模型、对话代理和企业自动化解决方案而设计。

数据集包含内容

  • 结构化的多轮对话。
  • 按说话者分离的对话(客服人员和客户)。
  • 特定领域的业务互动。
  • 经过清理和标准化的文本,可直接供模型使用。
  • 符合合规要求的数据来源。

关键AI应用场景

  • 用于客户支持副驾驶的LLM微调。
  • 对话式AI和语音/聊天代理。
  • 自动工单分类和路由。
  • 情感分析和客户流失预测模型。
  • 合规监控和质量保证自动化。

数据字典(表:EN_AU_CALL_CENTRE_TRANSCRIPTIONS)

列名 数据类型 描述(根据数据预览推断)
CONTENT Varchar 转录文本内容
LANGUAGE Varchar 语言代码(例如:en_AU)
LOUDNESSLEVEL Varchar 响度级别(例如:Normal)
PRIMARYTYPE Varchar 主要类型(例如:Speech, Noise)
SEGMENTID Varchar 片段ID
SEGMENTLANGUAGES Varchar 片段语言
SPEAKERID Varchar 说话者ID
TRANSCRIPT_DOMAIN Varchar 转录领域(例如:Call-center)
TRANSCRIPT_ID Varchar 转录ID
TRANSCRIPT_LANGUAGES Varchar 转录语言
TRANSCRIPT_NAME Varchar 转录名称(例如:MULTI_SPEAKER_LONG_FORM_TRANSCRIPTION)
TRANSCRIPT_TOPIC Varchar 转录主题(例如:Retail; Information and Technology)
START_T Float 开始时间
END_T Float 结束时间

使用示例

  • 获取所有转录数据: sql Select * from EN_AU_CALL_CENTRE_TRANSCRIPTIONS

访问信息

  • 提供商:DATAmundi
  • 许可:免费试用(内容有限)
  • 试用状态:可用
  • 完整数据集访问:需联系DATAmundi团队

数据产品详情

  • 刷新策略:静态数据产品
  • 云区域可用性(AWS):非洲(开普敦)、亚太(雅加达)、亚太(孟买)、亚太(大阪)等49个区域。
  • 法律条款:标准条款

提供商联系信息

  • 销售:sales@datamundi.ai
  • 支持:https://datamundi.ai/contact/
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作