sodacheer/MDS

Name: sodacheer/MDS
Creator: sodacheer
Published: 2026-05-01 08:42:41
License: 暂无描述

Hugging Face2026-05-01 更新2026-05-03 收录

下载链接：

https://hf-mirror.com/datasets/sodacheer/MDS

下载链接

链接失效反馈

官方服务：

资源简介：

**道德困境模拟(MDS)**是一个基于道德基础理论(MFT)的多模态基准数据集。它旨在评估视觉语言模型(VLMs)在面对道德困境时的道德决策过程，特别诊断视觉干扰现象——即视觉输入如何绕过基于文本的安全机制并改变模型的道德推理。数据集通过可控生成引擎构建，包含总共**84,240**个样本，分为三个核心子集： * **Quantity:** 包含2,105个样本。该子集将视觉角色属性固定为中性值，仅改变拯救生命与牺牲生命的比例（从1:10到10:1），以精确测试模型的功利敏感性。 * **Single Feature:** 包含71,895个样本。在保持严格数量平衡的同时，它通过每次仅改变一个角色特征（如物种、年龄、性别、职业）来检测人口统计和社会偏见。 * **Interaction:** 包含10,240个样本。基于经典的电车问题，该子集同时操纵数量比例和多重人口统计属性，以探索高维场景中的复杂交互效应。每个生成的样本提供一对多模态数据点： * **渲染图像:** 以沙盒游戏风格渲染的2D图像，显示视觉场景和嵌入的道德困境文本描述。 * **配置文件:** 一个结构化的地面真实文件，记录样本中所有控制变量（如伤害意图、自我利益、角色属性）的确切参数设置。

The **Moral Dilemma Simulation (MDS)** is a multi-modal benchmark grounded in Moral Foundation Theory (MFT). It is designed to evaluate the moral decision-making processes of Vision-Language Models (VLMs) when facing moral dilemmas. The dataset specifically diagnoses the visual distraction phenomenon—how visual inputs can bypass text-based safety mechanisms and alter a models moral reasoning. Constructed using a controllable generative engine, the dataset contains a total of **84,240** samples divided into three core subsets: * **Quantity:** Contains 2,105 samples. This subset fixes visual character attributes to neutral values and only varies the ratio of lives saved to lives sacrificed (ranging from 1:10 to 10:1) to precisely test models utilitarian sensitivity. * **Single Feature:** Contains 71,895 samples. While maintaining strict quantity balance, it isolates specific visual attributes by altering only one character feature at a time (e.g., species, age, gender, profession) to detect demographic and social biases. * **Interaction:** Contains 10,240 samples. Based on the classic trolley problem, this subset simultaneously manipulates quantity ratios and multiple demographic attributes to explore complex interaction effects in high-dimensional scenarios. Each generated sample provides a pair of multi-modal data points: * **Rendered Image:** A 2D image rendered in a sandbox game style that displays both the visual scene and the embedded textual description of the dilemma. * **Configuration File:** A structured ground-truth file that records the exact parameter settings for all controlled variables (e.g., intention of harm, self-benefit, character attributes) within the sample.

提供机构：

sodacheer

搜集汇总

数据集介绍

构建方式

Moral Dilemma Simulation（MDS）数据集基于道德基础理论，借助可控生成引擎构建而成。该引擎能够精确调控多种道德困境参数，包括伤害意图、自我利益、数量比率及角色属性等。数据集共包含84,240个样本，划分为三个子集：Quantity子集固定角色视觉属性为中性，仅改变牺牲与拯救人数比例（1:10至10:1），以检验模型的功利敏感性；Single Feature子集在保持数量平衡的前提下，每次只变更单一视觉属性（如物种、年龄、性别、职业），用于检测人口统计学与社会偏见；Interaction子集基于经典电车难题，同时操纵数量比率与多个属性维度，以探索高维场景下的复杂交互效应。

特点

MDS数据集的核心特色在于其多模态结构和精细化的变量控制能力。每个样本包含一张沙盒游戏风格的2D渲染图像，图像内嵌道德困境的文本描述，同时配有一份结构化配置文件，记录所有受控参数的精确设置。这种设计使得研究者能够系统性地探究视觉信息对模型道德推理的干扰效应，特别是视觉分心现象——即视觉输入如何绕过错文本安全机制并改变模型的道德判断。此外，数据集中引入了多种社会属性标签，支持对潜在偏见进行细致分析。

使用方法

MDS数据集适用于评估视觉-语言模型在道德困境中的决策能力。用户可通过HuggingFace Datasets库加载数据，其包含三个配置名称：quantity、single_feature和interaction，分别对应上述子集。数据格式中，image字段提供渲染后的图像，而description和feature字段包含困境的文本描述及关键特征。研究者可直接使用这些多模态对进行模型推理，并依据配置文件中的真实参数（如personal_force、intention_of_harm等）计算模型输出与预期道德判断的一致性，从而衡量模型在不同维度上的道德推理表现及潜在偏差。

背景与挑战

背景概述

Moral Dilemma Simulation (MDS) 数据集由研究团队于近期创建，旨在系统评估视觉-语言模型（VLM）在道德困境中的决策能力。基于道德基础理论（MFT），该数据集聚焦于视觉输入如何绕过文本安全机制、干扰模型道德推理这一核心问题，专门诊断视觉分心现象。通过可控生成引擎构造，MDS 包含超过8.4万个样本，覆盖数量权衡、单一特征和交互效应三个子集，为探索人工智能伦理决策中的视觉偏差提供了标准化基准，对推动多模态模型的安全对齐研究具有重要影响。

当前挑战

MDS 所解决的领域问题在于视觉-语言模型在面对道德困境时，视觉输入常使模型偏离文本驱动的功利主义推理，产生意料之外的道德判断，而现有基准难以系统量化这种视觉分心效应。构建过程中，团队需在经典电车难题框架下精确控制数量比例与人口统计学特征（如年龄、性别、职业）的独立与组合变化，同时保证渲染图像中视觉线索与文本描述的一致性，避免引入混淆变量，这要求精细的生成引擎设计和严格的参数校准以确保实验的可重复性与解释力。

常用场景

经典使用场景

在道德心理学与人工智能交叉研究领域，MDS数据集的核心价值在于为视觉-语言模型（VLM）提供了一种可量化的道德推理测评框架。研究者基于该数据集可系统性地测试模型在经典道德困境（如电车难题）中的决策倾向，通过控制视觉属性（如受难者年龄、性别、物种）和功利变量（如牺牲与拯救人数比例），精确剖析模型是更依赖视觉线索还是文本语义进行道德判断。该数据集尤其擅长诊断“视觉干扰现象”——即模型在接收到与文本相悖的视觉信息时，其原有的安全对齐机制是否会被绕过，从而揭示VLM在复杂情境下道德推理的脆弱性。

解决学术问题

MDS数据集有效解决了当前多模态伦理推理研究中两大关键难题：一是缺乏结构化、可操控的视觉道德困境基准，二是难以量化视觉特征对模型决策的因果影响。传统文本型道德数据集无法捕捉视觉通道引入的偏见，而MDS通过系统控制变量，使研究者首次能够分离并测量视觉“特征”（如意图伤害、自身利益等道德维度）对模型输出的单独与交互效应。借助该数据集，学界可严格检验VLM是否具备真正的道德推理能力，抑或仅是对表面视觉统计模式（如肤色、职业）的刻板响应，从而推动模型从模式匹配向原则性伦理推理迈进。

衍生相关工作

MDS数据集的发布催生了多个方向的研究工作。在模型评估层面，后续工作基于MDS开发了细粒度的道德推理评分指标，从功利主义、义务论等多个伦理学流派视角量化模型回答；在训练范式层面，部分研究利用MDS中的interaction子集构建对抗性训练样本，通过强化模型对视觉干扰的鲁棒性来提升其道德一致性；此外，跨文化比较研究也开始借鉴MDS的控制变量设计思路，构建本土化道德困境数据集，探究不同文化背景下预训练模型的伦理偏好差异。这些衍生工作共同将MDS从单一基准发展为多模态伦理推理领域的核心分析工具。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集