five

大模型幻觉检测评估高质量数据集

收藏
广东省数据知识产权存证登记平台2025-10-31 更新2026-04-17 收录
下载链接:
https://data.gpic.gd.cn/dataStorage/credentialInfo.jhtml?no=20251044000017375
下载链接
链接失效反馈
官方服务:
资源简介:
本数据集面向大语言模型幻觉治理需求,基于“动静知识分离”标注范式构建,涵盖静态知识(如历史事件、科学定理)与动态知识(如实时新闻、市场数据),支撑模型幻觉检测、评估与治理全流程。 数据处理采用自研知识属性识别平台,结合语义分析与时态特征算法,实现对原始查询的知识类型分类、置信度评分与幻觉风险标注。流程遵循GB/T 25000系列标准,执行“专家标注+模型辅助+多轮校验”质控机制,标注一致性Kappa系数≥0.85。所有数据经严格去标识化处理,删除直接标识符,对地理位置与时间进行模糊化与偏移脱敏,符合《GB/T 35273-2020》等安全规范。 数据集适用于大模型能力评估、幻觉检测系统训练、RAG系统触发优化,以及金融、医疗、法律等高可信要求领域的AI部署。数据来源于我司自行生产,依托内部平台构建题目模板与对抗样本,经专家核验与多轮复核形成完整证据链,权属清晰、质量可控。 覆盖20余个垂直领域,包含10万+标注样本,支持分类、回归等建模任务,为大模型研发与治理提供高质量、合规的数据基础。
提供机构:
广东智媒云图科技股份有限公司
创建时间:
2025-10-31
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集基于“动静知识分离”标注范式构建,涵盖静态知识与动态知识,包含10万+标注样本,覆盖20余个垂直领域,适用于大模型幻觉检测、评估与治理全流程。数据采用三层质控机制(Kappa系数≥0.85),并经过严格去标识化处理,符合安全规范,支持金融、医疗等高可信领域的AI部署。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作