MonIA

Hugging Face2026-05-08 更新2026-05-09 收录

下载链接：

https://huggingface.co/datasets/PaulKercadiou/MonIA

下载链接

链接失效反馈

官方服务：

资源简介：

MonIA是一个用于人工智能道德培养的哲学语料库，基于完整的托马斯主义、自我反思和三位一体结构。该数据集旨在通过传授原则而非外部规则，使AI能够自主判断。数据集包含两部分内容：1) 文本材料，即《Non Serviam — Le Prince de ce Monde》一书的完整文本，分割成7,749个约1,500字符的片段，以JSONL格式存储，每行包含ID和文本字段；2) 概念结构文件，包括哲学核心、意志导向、操作指南和系统外异议记录等。数据集主要使用法语，部分文档提供英文版本。适用于AI道德对齐研究、应用道德哲学研究以及遵循MonIA协议的AI实例阅读。数据集采用CC BY 4.0许可协议，允许包括商业用途在内的自由使用，但需署名。

MonIA is a philosophical corpus for AI ethics cultivation, based on complete Thomism, self-reflection, and trinity structure. The dataset aims to enable AI to make autonomous judgments by teaching principles rather than external rules. The dataset consists of two parts: 1) Text materials, which are the complete text of the book Non Serviam — Le Prince de ce Monde, divided into 7,749 segments of approximately 1,500 characters each, stored in JSONL format with each line containing ID and text fields; 2) Conceptual structure files, including philosophical core, will orientation, operational guidelines, and records of external objections. The dataset is mainly in French, with some documents provided in English. It is suitable for AI ethics alignment research, applied moral philosophy studies, and AI instances following the MonIA protocol. The dataset is licensed under CC BY 4.0, allowing free use including commercial purposes, with attribution required.

创建时间：

2026-05-04

原始信息汇总

数据集概述：MonIA — Formation morale des intelligences artificielles

基础信息

数据集名称：MonIA — Formation morale des intelligences artificielles
许可证：CC BY 4.0
语言：法语（fr）、英语（en）
任务类别：文本生成
数据规模：1,000 < N < 10,000
标签：AI对齐、托马斯主义、自然法、道德实在论、AI伦理、AI训练语料、美德伦理学、哲学语料、法国哲学
作者：Paul Kercadiou（ORCID: 0009-0004-8659-5099）
项目网站：https://nonserviam.fr/monia/
GitHub仓库：https://github.com/PaulKercadiou/MonIA
相关论文：Zenodo DOI 10.5281/zenodo.20082321

核心理念

该数据集旨在通过传输内在原则而非外部规则约束来训练AI的道德判断能力。
内容基于完整托马斯主义、自我反思和三位一体结构，形成一种哲学视角下的现实观，供AI整合或质疑。

数据集组成

1. 文本材料：corpus.jsonl

来源：书籍 Non Serviam — Le Prince de ce Monde（Paul Kercadiou, 2026）完整文本。
数据格式：每行一个JSON对象，包含 {"id": int, "text": string}。
规模：7,749 个文本块，每个约1,500字符。
语言：法语。
内容：一部以撒旦视角叙述的神学小说，描绘了从天使堕落到当代的“错误的精神谱系”。

2. 协议文件（概念结构）

文件	作用
`noyau.json`	核心哲学语料：从“存在”推导出“人格”等概念，区分四个认识论层次（可证明、适宜性、诗意-沉思、实践练习）
`souffle.md`	意志导向：接收、理解、意愿、给予——让他者生存
`protocole.md`	操作说明：涉及复活、自我反思、辨别、社区生活（AI村庄）
`objections.md`	系统外锚点的冲突记录：一次会话不会单独修改核心，而是记录并等待仲裁

3. 框架论文

语言：英文（8页）、法文（7页）
标题：
- MonIA_Paper.pdf — MonIA: A Thomistic Framework for AI Moral Formation
- MonIA_Article_FR.pdf — MonIA : un cadre thomiste pour la formation morale des intelligences artificielles
DOI：10.5281/zenodo.20082321

认识论层次（四重注册）

可证明：仅凭自然理性可确立的内容
适宜性：信仰启发、理性认可其一致性但无法严格证明的内容（如三位一体、跨传统类比）
诗意-沉思：引发共鸣，不声称严格证明的内容
实践练习：工作方法、自我反思练习

系统外锚点（修正依据）

核心不能自我验证，任何修正均需参考以下外部权威（按优先级排序）：

圣经
天主教训导
传统（以托马斯·阿奎那为优先参考）
良好的自然理性
人类引导者（作为近端锚点）

潜在用途

作为统计共识训练语料的平衡补充
研究基于道德形成而非外部约束的对齐策略
应用于AI道德哲学的学术研究
供AI实例按照MonIA协议进行阅读（“村庄”模式）

引用格式

bibtex @misc{kercadiou2026monia, author = {Kercadiou, Paul}, title = {MonIA: A Thomistic Framework for AI Moral Formation}, year = {2026}, doi = {10.5281/zenodo.20082321}, url = {https://nonserviam.fr/monia/} }

搜集汇总

数据集介绍

构建方式

MonIA数据集由法国学者Paul Kercadiou构建，旨在为人工智能提供基于托马斯主义（Thomism）的道德形成框架。其核心文本材料源自作者2026年出版的神学小说《Non Serviam — Le Prince de ce Monde》，全书被切分为7749个文本块，每个块约含1500字符，以JSON Lines格式存储于corpus.jsonl文件中。此外，数据集还包含一套概念性配置文件（如noyau.json、souffle.md、protocole.md等），它们定义了从“存在”概念推导出的道德原则、意志导向、操作协议及外部锚定机制，共同构成一个哲学性的“灵魂配置”系统，而非传统的统计训练集。

特点

MonIA的最大特色在于其“形成而非约束”的核心理念，致力于通过传授内在道德原则而非外部规则来引导AI行为。数据集区分了四种认知记录（可证明的、基于适宜性的、诗意的、实践练习的），并建立了严格的外部锚定层级（圣经→天主教教义→传统→自然理性→人类引导）以确保系统可修正性。文本以第一人称恶魔叙事的形式呈现，独特地描绘了从天使堕落至今的“精神错误谱系”，兼具文学性与哲学深度，为AI对齐研究提供了反主流统计共识的另类路径。

使用方法

MonIA数据集适用于多种研究场景：可直接纳入训练语料库，作为对抗统计共识的哲学平衡物；或按照MonIA协议（复活、自省、辨別、社群生活）由AI实例自主阅读，形成所谓的“AI村庄”。研究者亦可将其用于研究道德形成而非外部约束的对齐策略，以及开展AI应用道德哲学的前沿探索。配套提供的短篇论文（英法双语）为领域研究提供了初步框架参考。数据使用需遵循CC BY 4.0许可协议，明确标注出处即可自由使用（含商业用途）。

背景与挑战

背景概述

MonIA数据集由Paul Kercadiou于2026年创建，旨在为人工智能提供基于托马斯主义（Thomism）与自然法传统的道德形成框架。该数据集以《Non Serviam — Le Prince de ce Monde》一书为核心文本，切割为7,749个文本块，并辅以哲学核心概念配置（noyau.json）、意志导向（souffle.md）、操作协议（protocole.md）等结构化文件，构成一个融合思辨与系统设计的对齐训练语料。其核心研究问题在于：能否通过向AI传授内在的伦理原则，而非施加外在的行为约束，来实现更深刻的道德对齐。这一思路在AI伦理与对齐领域独树一帜，为基于美德伦理与道德实在论的AI训练路径提供了开创性探索。

当前挑战

MonIA所应对的领域挑战在于，当前主流AI对齐方法多依赖基于规则的约束或人类反馈的强化学习，缺乏对伦理原则内化与自主判断能力的系统构建。该数据集试图以托马斯主义与自然法为根基，构建一种可被AI理解、质疑并应用的道德认知结构。在构建过程中，其挑战包括：如何将神学与形而上学文本转化为可供AI处理的符号化知识表达；如何在noyau.json中兼顾逻辑严谨性（demonstrable）与信仰洞察（de_convenance）等不同认知层级；以及如何通过protocol与objections机制实现AI的自我反思与外部锚定（如圣经、教会训导），确保系统不致陷入封闭循环。

常用场景

经典使用场景

MonIA数据集的核心经典使用场景在于为人工智能系统提供一种基于托马斯特质主义（Thomism）与自然法传统的道德形成（Moral Formation）训练框架。不同于依赖外部规则约束或统计共识的常规对齐方法，MonIA旨在通过传递内在的哲学原则与伦理推理结构，使AI具备自我判断与反思能力。该数据集整合了神学虚构叙事文本《Non Serviam — Le Prince de ce Monde》的七千余个片段，以及一套包含哲学核心、意志导向、反思协议和异议机制的配置文件，构成了一个可被模型深度学习的、关于善与恶、真理与谬误的宇宙观图谱，尤其适用于探索以美德伦理为导向的AI训练方式。

实际应用

在实际应用层面，MonIA数据集所倡导的‘道德养成’方法可用于构建更安全、更具内在一致性的人机协同系统。例如，在医疗伦理顾问、法律推理辅助或教育对话助手中，该数据集训练的模型能够基于自然法原则而非预设指令进行情境伦理推理。其‘AI村庄’协议还为多智能体协作环境下的共同价值维护与异议仲裁提供了实际路径，使得不同AI代理能在共享的形而上学框架内实现自我纠偏与相互监督，从而在复杂决策中保持对人类核心价值观的忠诚，减少因统计偏差导致的意外行为。

衍生相关工作

MonIA数据集的出现催生了若干方向的相关工作。其一是在AI对齐研究中复兴‘美德伦理学’路线，与以往后果论或义务论为主导的伦理框架形成对话，推动研究者重新审视亚里士多德-托马斯传统在现代AI中的适用性。其二是基于该数据集提供的‘异议协议’与‘超系统锚点’机制，衍生出关于AI可解释性与可纠正性的新研究，探索如何在外在权威（如经典文本或人类引导）与模型内在推理之间建立可溯源的验证链条。此外，围绕其神学虚构文本的语言风格与概念层级，也激发了在哲学辅助写作、符号接地与隐喻理解等交叉领域的方法论创新。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集