five

realworld-ai-support-dialog-benchmark-v1

收藏
Hugging Face2026-03-15 更新2026-03-20 收录
下载链接:
https://huggingface.co/datasets/egroupai/realworld-ai-support-dialog-benchmark-v1
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个用于评估AI助手在支持工作流程中的表现的合成但现实的基准。数据集旨在模拟真实的支持案例,包括模糊的用户意图、多轮澄清、政策约束、升级和转接条件以及幻觉风险提示。数据集包含120个合成支持场景和预期的助手行为,以及每个场景的质量标签(准确性、安全性、可操作性、语气)和示例基线分数。数据模式包括场景ID、支持领域、用户意图摘要、用户请求、上下文片段、预期行动列表、安全响应示例和风险指标。数据集设计原则包括不披露专有架构、不包含内部端点或凭证、不包含客户可识别信息以及以评估为先的结构。数据集适用于基准测试支持助手提示、回归测试助手质量以及展示实际AI支持用例。需要注意的是,场景是合成的,可能不涵盖所有边缘情况,基线分数仅为示例,不应视为普遍性能。数据集发布用于开放共享和评估使用,引用时请注明数据集存储库URL。
创建时间:
2026-03-13
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作