five

Korean Call Center Transcripts - 170K Chars

收藏
Snowflake2026-03-23 更新2026-03-27 收录
下载链接:
https://app.snowflake.com/marketplace/listing/GZSYZVBO4W
下载链接
链接失效反馈
官方服务:
资源简介:
**Dataset Overview** Nearly 170K Chars of high-quality, human-validated Korean (ko_KR) Agent/Customer conversations captured from real-world, multi-domain call center interactions. The dataset reflects authentic customer service dialogue across industries, featuring natural speech patterns, real problem-solving flows, emotional variability, and domain-specific language that cannot be replicated through synthetic or scripted data. It is specifically designed for training and fine-tuning large language models, conversational agents, and enterprise automation solutions. **Our datasets include:** - Structured multi-turn dialogues - Speaker-separated conversations (agent and customer) - Domain-specific business interactions - Cleaned and normalized text for direct model ingestion - Compliance-ready data sourcing **Key AI use cases** - LLM fine-tuning for customer support copilots - Conversational AI and voice/chat agents - Automated ticket classification and routing - Sentiment and churn prediction models - Compliance monitoring and quality assurance automation This is a free, content-limited trial. For access to the full dataset, please reach out to our team.
提供机构:
DATAmundi
创建时间:
2025-12-15
原始信息汇总

Korean Call Center Transcripts - 170K Chars 数据集概述

数据集基本信息

  • 数据集名称: Korean Call Center Transcripts - 170K Chars
  • 提供商: DATAmundi
  • 访问模式: 免费试用
  • 数据状态: 静态数据产品

数据集内容描述

  • 数据量: 近17万字符的高质量、人工验证的韩语(ko_KR)客服对话。
  • 数据来源: 采集自真实世界、多领域的呼叫中心互动。
  • 数据特征:
    • 包含跨行业的真实客户服务对话。
    • 具有自然的语音模式、真实的问题解决流程、情绪变化以及特定领域的语言。
    • 非合成或脚本数据,无法被复制。
  • 数据结构:
    • 结构化的多轮对话。
    • 说话人分离的对话(客服代表和客户)。
    • 特定领域的业务互动。
    • 经过清理和规范化的文本,可直接供模型使用。
    • 符合合规要求的数据源。

设计目的与主要AI用例

  • 设计目的: 专门用于训练和微调大型语言模型、对话代理和企业自动化解决方案。
  • 关键AI用例:
    • 用于客户支持副驾驶的LLM微调。
    • 对话式AI及语音/聊天代理。
    • 自动化工单分类和路由。
    • 情感和客户流失预测模型。
    • 合规监控和质量保证自动化。

数据字典(表结构)

  • 表名: KO_KR_CALL_CENTRE_TRANSCRIPTIONS
  • 列定义:
    • CONTENT: Varchar
    • LANGUAGE: Varchar
    • LOUDNESSLEVEL: Varchar
    • PRIMARYTYPE: Varchar
    • SEGMENTID: Varchar
    • SPEAKERID: Varchar
    • TRANSCRIPT_DOMAIN: Varchar
    • TRANSCRIPT_ID: Varchar
    • TRANSCRIPT_LANGUAGES: Varchar
    • TRANSCRIPT_NAME: Varchar
    • TRANSCRIPT_TOPIC: Varchar
    • START_T: Float
    • END_T: Float

使用示例

  • 查询所有转录数据: sql Select * from KO_KR_CALL_CALL_CENTRE_TRANSCRIPTIONS

访问与支持信息

  • 试用说明: 此为免费的、内容有限的试用版。如需访问完整数据集,请联系DATAmundi团队。
  • 销售联系: sales@datamundi.ai
  • 支持联系: https://datamundi.ai/contact/

云区域可用性

  • 云平台: AWS
  • 可用区域示例: 非洲(开普敦)、亚太(雅加达)、亚太(孟买)、亚太(大阪)等。

提供商信息

  • 提供商名称: DATAmundi
  • 提供商描述: 全球人类AI数据解决方案提供商,专注于创建、训练和评估为全球AI系统提供支持的多语言数据集。拥有超过14年的语言和数据专业知识,结合人类智能、机器学习和文化洞察,构建可扩展、道德且值得信赖的AI。提供200多种语言的高质量数据。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作