five

PHD (Passage-level Hallucination Detection)

收藏
arXiv2023-10-24 更新2024-06-21 收录
下载链接:
https://github.com/maybenotime/PHD
下载链接
链接失效反馈
官方服务:
资源简介:
PHD数据集是由北京大学计算机技术研究所等机构创建,用于评估段落级幻觉检测方法的高质量基准。该数据集通过ChatGPT生成,包含300个样本,分为低、中、高三个数据量级,反映了模型在不同知识量级下的幻觉生成情况。数据集的创建过程涉及从维基百科提取实体,使用ChatGPT生成幻觉数据,并通过严格的人工标注流程确保数据质量。PHD数据集主要应用于自然语言处理领域,旨在解决大型语言模型在生成文本时可能产生的幻觉问题,提高模型在关键任务中的可靠性和准确性。

The PHD dataset is a high-quality benchmark developed by the Institute of Computer Technology at Peking University and other institutions, designed for evaluating paragraph-level hallucination detection methods. Generated using ChatGPT, this dataset comprises 300 samples categorized into three tiers: low, medium, and high, which reflect the hallucination generation performance of models across varying knowledge scales. The dataset's construction workflow involves extracting entities from Wikipedia, generating hallucinatory text data with ChatGPT, and employing a rigorous manual annotation process to ensure data quality. Primarily utilized in the field of natural language processing, the PHD dataset aims to address the hallucination issues that large language models (LLMs) may produce during text generation, thereby improving the reliability and accuracy of models in key tasks.
提供机构:
北京大学计算机技术研究所,北京大学数据科学研究中心,北京大学计算语言学教育部重点实验室
创建时间:
2023-10-10
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作