English AU Call Center Human-Validated Transcripts - 570K words
收藏Snowflake2026-03-23 更新2026-03-27 收录
下载链接:
https://app.snowflake.com/marketplace/listing/GZSYZVBO51
下载链接
链接失效反馈官方服务:
资源简介:
**Dataset Overview**
Nearly 570K words (3.1M Chars) of high-quality, human-validated English (AU) agent–customer conversations captured from real-world, multi-domain call center interactions. The dataset reflects authentic customer service dialogue across industries, featuring natural speech patterns, real problem-solving flows, emotional variability, and domain-specific language that cannot be replicated through synthetic or scripted data.
It is specifically designed for training and fine-tuning large language models, conversational agents, and enterprise automation solutions.
**Our datasets include:**
- Structured multi-turn dialogues
- Speaker-separated conversations (agent and customer)
- Domain-specific business interactions
- Cleaned and normalized text for direct model ingestion
- Compliance-ready data sourcing
**Key AI use cases**
- LLM fine-tuning for customer support copilots
- Conversational AI and voice/chat agents
- Automated ticket classification and routing
- Sentiment and churn prediction models
- Compliance monitoring and quality assurance automation
This is a free, content-limited trial. For access to the full dataset, please reach out to our team.
提供机构:
DATAmundi
创建时间:
2025-12-15
原始信息汇总
English AU Call Center Human-Validated Transcripts - 570K words
数据集概述
- 包含近57万单词(310万字符)高质量、人工验证的英语(澳大利亚)客服人员与客户对话。
- 数据源自真实世界、多领域的呼叫中心互动,反映了跨行业的真实客户服务对话。
- 特征包括自然语音模式、真实问题解决流程、情感变化以及特定领域语言,无法通过合成或脚本数据复制。
- 专为训练和微调大型语言模型、对话代理和企业自动化解决方案而设计。
数据集包含内容
- 结构化的多轮对话。
- 按说话者分离的对话(客服人员和客户)。
- 特定领域的业务互动。
- 经过清理和标准化的文本,可直接供模型使用。
- 符合合规要求的数据来源。
关键AI应用场景
- 用于客户支持副驾驶的LLM微调。
- 对话式AI和语音/聊天代理。
- 自动工单分类和路由。
- 情感分析和客户流失预测模型。
- 合规监控和质量保证自动化。
数据字典(表:EN_AU_CALL_CENTRE_TRANSCRIPTIONS)
| 列名 | 数据类型 | 描述(根据数据预览推断) |
|---|---|---|
| CONTENT | Varchar | 转录文本内容 |
| LANGUAGE | Varchar | 语言代码(例如:en_AU) |
| LOUDNESSLEVEL | Varchar | 响度级别(例如:Normal) |
| PRIMARYTYPE | Varchar | 主要类型(例如:Speech, Noise) |
| SEGMENTID | Varchar | 片段ID |
| SEGMENTLANGUAGES | Varchar | 片段语言 |
| SPEAKERID | Varchar | 说话者ID |
| TRANSCRIPT_DOMAIN | Varchar | 转录领域(例如:Call-center) |
| TRANSCRIPT_ID | Varchar | 转录ID |
| TRANSCRIPT_LANGUAGES | Varchar | 转录语言 |
| TRANSCRIPT_NAME | Varchar | 转录名称(例如:MULTI_SPEAKER_LONG_FORM_TRANSCRIPTION) |
| TRANSCRIPT_TOPIC | Varchar | 转录主题(例如:Retail; Information and Technology) |
| START_T | Float | 开始时间 |
| END_T | Float | 结束时间 |
使用示例
- 获取所有转录数据: sql Select * from EN_AU_CALL_CENTRE_TRANSCRIPTIONS
访问信息
- 提供商:DATAmundi
- 许可:免费试用(内容有限)
- 试用状态:可用
- 完整数据集访问:需联系DATAmundi团队
数据产品详情
- 刷新策略:静态数据产品
- 云区域可用性(AWS):非洲(开普敦)、亚太(雅加达)、亚太(孟买)、亚太(大阪)等49个区域。
- 法律条款:标准条款
提供商联系信息
- 销售:sales@datamundi.ai
- 支持:https://datamundi.ai/contact/



