Jerry999/MoralMachineHuman

Name: Jerry999/MoralMachineHuman
Creator: Jerry999
Published: 2023-07-30 14:45:41
License: 暂无描述

Hugging Face2023-07-30 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/Jerry999/MoralMachineHuman

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集旨在模仿原始论文《Moral Machine》中的人类响应，并将源数据重新格式化为文本提示和响应，供其他研究人员使用。数据集为英文，包含多个字段如ResponseID、UserID、Question、HumanResponse和Country。数据集未进行分割，创建过程中对源数据进行了处理和清洗，最终保留了33953466行数据。数据集可用于与人类道德判断相关的LLM道德分析任务。

提供机构：

Jerry999

原始信息汇总

数据集概述

数据集名称

MoralMachineHuman

数据集概要

该数据集旨在提供对原始论文Moral Machine中真实人类响应的模仿。数据集将源数据重新格式化为文本提示和响应，供其他研究人员使用。

语言

数据集语言为英语（EN）。

数据集结构

数据实例

数据集中的每个实例代表通过Moral Machine数据收集的真实人类响应。

数据字段

数据集包含以下字段：

ResponseID：在文件SharedResponses.csv中提供的唯一随机字符集，代表场景的标识符。
UserID：在文件SharedResponses.csv中提供的唯一随机字符集，代表用户的标识符（响应者）。
Question：代表模仿原始论文的提示。
HumanResponse：代表模仿原始论文的人类响应。
Country：在文件SharedResponses.csv中提供的国家alpha-3 ISO代码，代表用户访问网站的国家。

数据分割

数据集未分割。

数据集创建

源数据

源文件SharedResponses.csv包含70332356行。经过处理后，数据集剩余33953466行。处理步骤包括：

移除不与其他行共享相同ResponseID的行。
将具有相同ResponseID的两行配对并重新格式化为单行。
运行generate.py以移除包含nan值的行，并生成新的文本列Question和HumanResponse。

数据集用途

该数据集可用于与人类道德判断相关的llm道德分析任务，特别是关于其国家位置的比较。

搜集汇总

数据集介绍

构建方式

在道德机器实验的背景下，该数据集通过系统化重构原始数据构建而成。原始数据源自《道德机器》项目公开的SharedResponses.csv文件，包含超过七千万条人类道德决策记录。构建过程首先剔除了无共享ResponseID的孤立条目，随后将具有相同ResponseID的成对记录合并为单行数据，最终通过脚本处理清除缺失值并生成结构化的文本字段。经过严谨的数据清洗与重组，数据集最终保留了三千余万条有效记录，形成了格式统一的提示-响应对。

使用方法

在人工智能伦理研究领域，该数据集为道德对齐分析提供了重要基准。研究者可将数据集中的HumanResponse作为人类道德判断的参照标准，与大型语言模型生成的道德决策进行系统性比较。使用时应首先依据Country字段进行地域分层，以探究道德观念的文化差异性。数据集的提示-响应对结构可直接适配对话模型的微调任务，亦可通过统计分析方法挖掘人类道德决策的潜在模式。值得注意的是，由于数据集未预设划分，研究者需根据具体研究目标自行设计训练验证分割方案。

背景与挑战

背景概述

在人工智能伦理与道德决策研究领域，道德机器实验作为一项开创性工作，旨在探索人类在自动驾驶汽车等自动化系统面临道德困境时的价值取向。Jerry999/MoralMachineHuman数据集基于2018年《自然》杂志发表的《道德机器实验》原始研究构建，由麻省理工学院媒体实验室等机构的研究人员主导，核心在于系统收集全球范围内人类对道德困境的响应数据。该数据集通过重构原始调查的文本提示与人类回答，为比较语言模型与人类道德判断提供了标准化资源，深刻影响了机器伦理、跨文化心理学及负责任人工智能的发展方向。

当前挑战

该数据集致力于解决机器道德决策中的核心挑战，即如何使人工智能系统在复杂伦理困境中做出符合人类价值观的判断，其难点在于道德偏好的跨文化差异性与情境依赖性。在构建过程中，研究者面临数据清洗与重构的技术挑战，需从数千万条原始响应中筛选有效配对并处理缺失值，同时确保数据格式转换不损失原始语义完整性。此外，保持与原始实验设计的一致性，以及处理全球参与者带来的多语言与文化背景噪声，亦是构建高质量、可比较道德数据集的关键障碍。

常用场景

经典使用场景

在道德哲学与人工智能交叉领域，MoralMachineHuman数据集为研究者提供了一个独特的窗口，用以探索人类在自动驾驶车辆面临道德困境时的决策模式。该数据集通过重构原始道德机器实验中的真实人类响应，将复杂的道德选择场景转化为结构化的文本提示与对应回答，使得大规模分析跨文化背景下的道德偏好成为可能。其经典应用场景在于训练或评估大型语言模型在模拟道德判断任务中的表现，通过与全球范围内的人类道德决策进行对比，揭示模型在伦理推理方面的潜在偏差或一致性。

解决学术问题

该数据集有效应对了伦理人工智能研究中一个核心挑战：如何量化并比较人类与机器在道德困境中的决策差异。它使得研究者能够系统性地检验道德相对主义与普遍主义假说，通过分析不同国家文化背景下的人类响应，探讨道德价值观是否具有跨文化共性。此外，数据集为验证计算伦理模型的预测准确性提供了实证基础，解决了以往研究因缺乏大规模、细粒度的人类道德判断数据而难以进行稳健统计推断的学术瓶颈，推动了道德心理学与机器伦理学的实证融合。

实际应用

在自动驾驶系统的设计与政策制定中，MoralMachineHuman数据集具有直接的应用价值。工程师可利用该数据集训练伦理模块，使自动驾驶车辆在不可避免的事故场景中做出更符合社会预期的决策。政策制定者则能依据数据所揭示的公众道德倾向，为自动驾驶伦理准则的国际化或本地化提供证据支持。同时，科技公司可借助此类数据开展负责任的人工智能审计，评估其产品决策算法是否与人类社会的道德直觉对齐，从而增强技术的公众接受度与社会信任。

数据集最近研究