realworld-ai-support-dialog-benchmark-v1

Hugging Face2026-03-15 更新2026-03-20 收录

下载链接：

https://huggingface.co/datasets/egroupai/realworld-ai-support-dialog-benchmark-v1

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是一个用于评估AI助手在支持工作流程中的表现的合成但现实的基准。数据集旨在模拟真实的支持案例，包括模糊的用户意图、多轮澄清、政策约束、升级和转接条件以及幻觉风险提示。数据集包含120个合成支持场景和预期的助手行为，以及每个场景的质量标签（准确性、安全性、可操作性、语气）和示例基线分数。数据模式包括场景ID、支持领域、用户意图摘要、用户请求、上下文片段、预期行动列表、安全响应示例和风险指标。数据集设计原则包括不披露专有架构、不包含内部端点或凭证、不包含客户可识别信息以及以评估为先的结构。数据集适用于基准测试支持助手提示、回归测试助手质量以及展示实际AI支持用例。需要注意的是，场景是合成的，可能不涵盖所有边缘情况，基线分数仅为示例，不应视为普遍性能。数据集发布用于开放共享和评估使用，引用时请注明数据集存储库URL。

创建时间：

2026-03-13

5,000+

优质数据集

54 个

任务类型

进入经典数据集