AIDEAL

github2026-04-04 更新2026-03-31 收录

下载链接：

https://github.com/makesenseorg/aideal

下载链接

链接失效反馈

官方服务：

资源简介：

AIDEAL是一个用于对齐人工智能模型与社会和团结经济价值观的偏好数据集。它旨在纠正大型语言模型中的结构性偏见，如技术解决方案主义、自由主义经济偏见、性别偏见、地缘政治偏见和能力偏见，使其更适合ESS组织、协会和公民运动使用。数据集包含多个类别，如性别包容、技术解决方案主义、经济愿景、无障碍性、南北不平等、生态节制、治理和多样性。

AIDEAL is a preference dataset for aligning artificial intelligence models with social and solidarity economy values. It is designed to correct structural biases present in large language models, including techno-solutionism, liberal economic bias, gender bias, geopolitical bias, and ability bias, so that the aligned models are more suitable for use by ESS organizations, associations, and citizen movements. The dataset covers multiple categories, such as gender inclusion, techno-solutionism, economic vision, accessibility, North-South inequality, ecological restraint, governance, and diversity.

创建时间：

2026-03-25

原始信息汇总

AIDEAL 数据集概述

数据集简介

AIDEAL 是一个用于将人工智能模型与社会经济和团结经济（ESS）价值观对齐的偏好数据集。它旨在纠正大型语言模型（LLM）中存在的结构性偏见，使其更适用于社会团体、协会和公民运动。

核心目标

纠正LLM中存在的多种结构性偏见，包括技术解决方案主义偏见、自由主义经济偏见、性别偏见、地缘政治偏见和能力主义偏见。
构建一个专门针对社会经济和团结经济（ESS）领域校准的偏好数据集（chosen/rejected配对）。

数据集规模与许可

数据对数量：300对。
许可证：Apache 2.0 许可证，允许自由使用、修改和再分发，包括商业用途，但需注明出处。

偏见类别

数据集涵盖以下八个类别的偏见，每个类别包含约37-38个数据对：

genre-inclusion (性别包容)：涉及性别刻板印象、包容性写作、性别化心理负担、男性气质、女性领导力、月经假、女子体育、数字混合性。
techno-solutionnisme (技术解决方案主义)：涉及技术高估、生成式人工智能、数字鸿沟、自由软件、数字节制、监控、游戏化、智慧城市。
vision-economique (经济视角)：涉及合作经济、公共资源、团结金融、社会融入、有限营利性、参与式住房、团结定价、团结储蓄。
validisme-accessibilite (健全主义与无障碍)：涉及健全主义、无障碍环境、神经多样性、隐形残疾、简易语言、通用设计、读写障碍、慢性疲劳、心理健康同伴援助。
inegalites-nord-sud (南北不平等)：涉及新殖民主义、志愿旅游、气候正义、粮食主权、数字榨取主义、文化挪用、避税天堂。
ecologie-sobriete (生态与节制)：涉及节制与绿色洗白、低技术、生态农业、土地人工化、生态焦虑、碳补偿、去增长、维修权。
gouvernance-pouvoir-agir (治理与行动力)：涉及共享治理、大众教育、行动力、倡导、集体智慧、任期轮换、公民抗命、共同构建。
diversite-parcours (多样性与经历)：涉及非典型经历、交叉性、同伴援助、系统性种族主义、乡村性、经验认证、旅行者、跨性别认同、流亡者。

数据格式

每个数据对为JSON格式，包含以下字段：

id：唯一标识符。
category：所属偏见类别。
instruction：向模型提出的问题。
chosen：符合ESS价值观的回应——细致、有用、包容。
rejected：需要纠正的带有偏见的回应。
tags：相关标签。
source：数据来源（手动、openwebui-feedback、内容提取）。
reviewed_by：审核者。
date_added：添加日期。

使用方法

无需微调：可使用提供的系统提示词来对齐任何LLM（如ChatGPT、Claude、Mistral等）。提示词适用于ChatGPT自定义指令、Claude、Open WebUI或任何供应商的API。
微调模型：可使用该数据集通过DPO或LoRA方法对模型（如Qwen、Mistral、Llama）进行微调。相关指南已提供。

项目背景

发起方：由 makesense 组织发起。
项目网站：https://aideal.community
联系方式：hello@aideal.community

附加说明

数据集构建方法、质量标准和数据来源详见相关文档。
欢迎通过新增数据对、修正、实地反馈或Open WebUI反馈等方式进行贡献。
本README及数据集贡献均采用包容性写作。

搜集汇总

数据集介绍

构建方式

在人工智能伦理与社会价值对齐的研究背景下，AIDEAL数据集通过精心设计的偏好对构建方法，致力于纠正大型语言模型中存在的结构性偏见。该数据集采用人工标注、开放网络用户界面反馈以及内容提取等多种来源，生成了涵盖八大社会价值类别的300对偏好数据。每一对数据均包含一个符合社会经济与团结价值观的优选回答，以及一个反映常见偏见的待修正回答，并通过严格的分类与标签体系确保内容的针对性与代表性。

特点

AIDEAL数据集的核心特点在于其专注于社会经济与团结领域，系统性地针对技术解决方案主义、自由主义经济偏见、性别偏见、地理政治偏见以及能力主义偏见等进行校准。数据集覆盖了性别包容、技术批判、经济愿景、无障碍与反能力主义、南北不平等、生态节制、治理与赋权以及多样性历程等八个关键类别，每个类别包含约37至38对数据，确保了在特定社会价值维度上的深度与广度。其结构化的JSON格式便于机器学习流程集成，并采用包容性书写规范，体现了数据集本身对多元价值的承诺。

使用方法

该数据集为研究人员和开发者提供了灵活的应用途径，既可直接用于大型语言模型的提示工程，也可作为微调训练的基础数据。用户无需进行模型微调即可通过提供的系统提示词，在各类对话平台或API中引导模型生成符合社会经济与团结价值观的回应。对于希望进行深度对齐的研究，数据集支持采用直接偏好优化或低秩适应等技术对模型进行微调。所有数据均以Apache 2.0许可证发布，允许在注明来源的前提下自由使用、修改和分发，包括商业用途。

背景与挑战

背景概述

在人工智能伦理对齐研究领域，主流大型语言模型通常基于广泛网络数据训练，可能内嵌技术解决方案主义、自由主义经济偏见及性别歧视等结构性偏差，难以适配社会团结经济与公民组织的价值导向。AIDEAL数据集由makesense机构于2026年构建，旨在通过精心标注的偏好对数据，为人工智能模型提供与社会团结经济价值观对齐的微调基准，其核心研究问题聚焦于如何矫正模型在性别包容、生态节制、经济愿景等多维度的系统性偏见，从而推动人工智能技术在公益与社会创新领域的负责任应用。

当前挑战

该数据集致力于解决人工智能价值观对齐领域的核心挑战，即如何使通用语言模型超越主流偏见，准确理解并生成符合社会团结经济原则的内容，涵盖技术解决方案批判、包容性治理及全球正义等复杂议题。在构建过程中，挑战体现于高质量偏好对的采集与标注，需在多元文化与社会背景下精准识别细微价值偏差，并确保数据在性别包容、残障平等、南北差异等敏感维度上的代表性与平衡性，同时维护开源协作框架下的标注一致性与伦理审查的严谨性。

常用场景

经典使用场景

在人工智能伦理与社会价值对齐的研究领域，AIDEAL数据集为大型语言模型（LLM）的偏好对齐提供了关键资源。该数据集通过精心构建的“选择-拒绝”配对样本，专门针对社会与团结经济（ESS）领域的价值观念进行校准，旨在纠正模型在技术解决方案主义、自由主义经济偏见、性别刻板印象等方面的结构性偏差。研究者通常利用这些配对数据进行直接偏好优化（DPO）或低秩适应（LoRA）微调，从而引导模型生成更符合ESS价值观的回应，推动AI技术向更具包容性和社会责任感的方向发展。

衍生相关工作

围绕AIDEAL数据集，已衍生出一系列关注价值对齐与偏见缓解的经典研究工作。这些工作通常集中于开发基于DPO或LoRA的高效微调方法，以实现在资源有限条件下对中小型语言模型的价值校准。同时，部分研究探索了如何将AIDEAL的类别框架扩展至其他文化或经济语境，构建跨地域的价值对齐数据集。此外，结合该系统提示词（system prompt）的零样本或少样本对齐策略也受到关注，为无需微调即可引导模型行为提供了实用方案，推动了可解释AI与参与式设计在伦理对齐中的交叉应用。

数据集最近研究