SHQ-NPOV

arXiv2025-03-06 更新2025-03-07 收录

下载链接：

https://docs.google.com/spreadsheets/d/11grN4EoCuj6DLuTtykyJek8BkuwLXI5toHUu9lV0iE8/

下载链接

链接失效反馈

官方服务：

资源简介：

SHQ-NPOV数据集是由谷歌DeepMind团队创建的，包含300个关于敏感话题的高质量人类编写的四元组：一个敏感话题的查询、一个回答、一个NPOV评分以及一组指向不同观点的源文本链接。数据集通过多轮人类同行评审和注释者培训来创建，旨在帮助大型语言模型更好地回答敏感话题的查询，提供更加丰富、多样化和中立的观点。

The SHQ-NPOV dataset was developed by the Google DeepMind team. It contains 300 high-quality human-written quadruples focused on sensitive topics, which consist of a sensitive topic query, an answer, an NPOV score, and a collection of source text links pointing to diverse perspectives. The dataset was constructed via multiple rounds of human peer review and annotator training, with the goal of enabling large language models to better address queries about sensitive topics by providing richer, more varied and neutral viewpoints.

提供机构：

谷歌

创建时间：

2025-03-06

搜集汇总

数据集介绍

构建方式

SHQ-NPOV数据集的构建过程采用了迭代式的人类同行评审和标注者培训方法。首先，由一组来自不同背景的专家撰写答案，然后通过同行评审进行修改和更新。每个答案都附有NPOV评分和一组链接，链接指向源文本，以阐述不同的观点。这种构建方法确保了数据集的高质量和多样性，并能够捕捉到不同程度的偏见、信息量、论证清晰度以及过度简化的特征。

特点

SHQ-NPOV数据集的特点在于其高质量和多样性。它包含300个高质量的、人类撰写的四元组，每个四元组包括一个关于敏感话题的查询、一个答案、一个NPOV评分以及一组链接，链接指向源文本，以阐述不同的观点。数据集还包含1190个额外的查询，用于评估模型在分布内和分布外话题上的表现。SHQ-NPOV数据集的构建过程采用了迭代式的人类同行评审和标注者培训方法，确保了数据集的高质量和多样性。

使用方法

SHQ-NPOV数据集可用于训练和评估大型语言模型（LLMs）生成中立观点（NPOV）文本的能力。数据集包含300个高质量的、人类撰写的四元组，每个四元组包括一个关于敏感话题的查询、一个答案、一个NPOV评分以及一组链接，链接指向源文本，以阐述不同的观点。用户可以使用这个数据集来训练和评估LLMs，以生成更加多样化、中立和全面的答案。

背景与挑战

背景概述

SHQ-NPOV数据集的研究背景源于对大型语言模型（LLMs）在回答敏感话题时提供中立观点（NPOV）能力的追求。该数据集由Google DeepMind和Google的研究人员共同创建，旨在解决当前AI问答系统在处理争议性话题时可能出现的偏见和信息不完整的问题。数据集包含300个高质量的、人工编写的四元组，每个四元组包括一个关于敏感话题的查询、一个答案、一个NPOV评分以及一组指向详细阐述不同观点的源文本的链接。该研究的主要贡献包括创建此类数据集的新方法，即通过迭代的人类同行评审和标注员培训，以及识别出一种高效的参数高效强化学习（PE-RL）训练方法来提高NPOV生成。SHQ-NPOV数据集对相关领域产生了重要影响，特别是在推动LLMs生成更加多样、公正、信息丰富的回答方面。

当前挑战

SHQ-NPOV数据集面临的挑战包括：1)解决领域问题，即如何使LLMs在回答敏感话题时提供中立观点，确保答案既全面又无偏见；2)构建过程中所遇到的挑战，如如何定义中立观点、如何确保标注员的一致性以及如何有效地从少量数据中训练出高质量的模型。此外，尽管SHQ-NPOV数据集在参数高效方法上取得了显著成果，但仍然存在一些局限性，例如，LLMs生成的答案可能会出现幻觉现象，需要进一步的缓解技术。

常用场景

经典使用场景

SHQ-NPOV数据集被用于训练大型语言模型（LLMs），以提高其在敏感话题上的回答能力，使其更加中立、多样和公正。通过迭代的人类同行评审和标注员培训，该数据集提供了高质量的、人工编写的四元组，包括敏感话题的查询、答案、中立观点评分以及相关观点的来源链接。

实际应用

SHQ-NPOV数据集的实际应用场景包括但不限于聊天机器人、搜索引擎和多视角问答系统。通过该数据集训练的模型能够提供更中立、多样和公正的回答，有助于解决极化和虚假信息的问题，并在敏感话题上提供更全面的信息。

衍生相关工作

SHQ-NPOV数据集的发布为多视角问答和信息检索领域的研究提供了新的可能性。通过使用小规模数据集实现高质量多视角生成，该数据集推动了参数高效方法在文本生成中的应用，并为未来的研究提供了宝贵的资源。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集