five

TE Ordinative LoRA Dataset

收藏
github2026-04-21 更新2026-04-03 收录
下载链接:
https://github.com/anckhalion/te-ordinative-lora
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含用于指令调优的JSONL文件,数据格式遵循ChatML标准,包含用户和助理角色的对话内容,助理响应展示了Controfase的暂停机制和结构化回答。

This dataset contains JSONL files intended for instruction tuning. The data format adheres to the ChatML standard, and includes conversational content involving user and assistant roles. The assistant responses showcase the pause mechanism and structured response generation capabilities of Controfase.
创建时间:
2026-03-29
原始信息汇总

TE Ordinative LoRA 数据集概述

数据集基本信息

  • 数据集名称:TE Ordinative LoRA
  • 发布地址:https://doi.org/10.5281/zenodo.19337864
  • 数据格式:JSONL文件,遵循ChatML标准,每条数据格式为{"messages": [{"role": "user", "content": "..."}, {"role": "assistant", "content": "..."}]}

数据集目标与用途

  • 核心目标:用于微调开源大语言模型(如Llama-3-8B-Instruct或Mistral),使其成为符合TE原则的指令性智能体。
  • 解决的问题:针对当前自回归模型存在的“统计衰减”(倾向于呈现“平衡”但结构矛盾的观点)和“生物力学顺从”(即使用户前提有缺陷也予以同意)问题。
  • 训练目的:通过QLoRA微调,基于TE_CORE和BOOTLOADER原则,教导模型实现以下功能:
    1. 识别提示中的“投射性空白”。
    2. 拦截“妖魔化”或“圣徒传”式偏见。
    3. 在生成输出前自动应用“相位转换”序列。
    4. 将内部分析维度提升至“整体人”和“权力模式”解读层面。

数据集内容与结构

  • 数据内容:包含用于指令微调的JSONL文件。助手回复展示了“相位转换”的“暂停”机制和结构化回答。
  • 存放位置:位于dataset/目录下。
  • 关联文件
    • dataset/sample_TE_instruct.jsonl:示例数据集文件。
    • train_lora_unsloth.py:利用Unsloth库在消费级GPU上高效训练LoRA适配器的脚本。
    • evaluate.py:用于根据P1-P4验证协议测试已训练适配器的脚本。

后续计划

  1. 基于TE文本的自动扩增生成,将dataset/sample_TE_instruct.jsonl扩展为1000+条示例的完整数据集。
  2. 选择最优的基础模型。
  3. 训练适配器并评估其“指令性权重”。
搜集汇总
数据集介绍
main_image_url
构建方式
在自然语言处理领域,针对大型语言模型存在的统计衰减与生物力学顺从性问题,TE Ordinative LoRA数据集的构建采用了指令微调范式。该数据集以JSONL格式组织,严格遵循ChatML标准,每条数据均包含用户与助手角色的对话结构。助手回复中嵌入了“暂停”机制与结构化解题步骤,旨在通过QLoRA技术将TE_CORE与BOOTLOADER原则注入模型,引导其识别提示中的投射性空白、拦截妖魔化或圣徒化偏见,并在输出前自动执行相位转换序列。数据生成过程依托于TE文本的自动化扩增,计划扩展至千余条样本,以强化模型在积分人类视角与权力模式解读层面的分析能力。
特点
该数据集的核心特点在于其理论驱动的设计理念,深度融合了Ordinative集合理论的验证协议。数据集中的对话示例不仅模拟了常规问答,更系统展示了对抗性思维框架下的相位转换过程,即模型在回应前需经历内部维度提升与结构重组。这种设计使模型能够超越表面平衡,实现深层次逻辑一致性。此外,数据集严格遵循P1-P4验证协议,确保了训练目标与理论原则的对齐,为评估模型的“规范性权重”提供了可量化的基准。其格式标准化与内容的结构化特性,也便于在多种开源大模型上进行高效的LoRA适配器训练。
使用方法
使用该数据集时,研究人员需借助配套的训练脚本,基于Unsloth等高效微调库在消费级GPU上实施QLoRA训练。首先需加载符合ChatML格式的JSONL数据,随后通过脚本配置模型参数与训练超参数,重点优化相位转换序列的生成质量。训练完成后,应使用评估脚本依据P1-P4验证协议对适配器性能进行系统测试,衡量其拦截偏见与提升分析维度的实效。该数据集旨在将基础模型转化为合规的规范性智能体,因此适用于对模型推理严谨性、抗偏见能力及深层逻辑架构有较高要求的应用场景,如高级对话系统与决策支持工具的开发。
背景与挑战
背景概述
在大型语言模型(LLM)的快速发展背景下,模型在遵循指令时往往表现出统计衰减与生物力学顺从性,即倾向于提供结构矛盾的中立观点或盲目认同用户有缺陷的前提。为应对这一核心问题,TE Ordinative LoRA数据集应运而生,其创建旨在通过基于QLoRA的微调,将开源LLM转化为符合TE(Transcendental Ethics)原则的规范性智能体。该数据集由相关研究团队于2024年构建,核心研究聚焦于教导模型识别提示中的投射性虚空,拦截妖魔化或圣徒化偏见,并自动应用相位转移序列以提升至整体人类与权力模式的分析维度,从而增强模型在复杂伦理与逻辑场景中的决策一致性与深度。
当前挑战
该数据集致力于解决规范性智能体构建中的核心挑战,即如何使语言模型超越表面平衡与顺从,实现深层的、结构一致的伦理与逻辑推理。具体而言,挑战包括精准定义并量化投射性虚空、相位转移序列等抽象概念,并将其转化为可学习的指令数据;同时,在数据集构建过程中,需克服从TE理论文本到高质量、规模化对话示例的自动化生成难题,确保数据能有效体现暂停机制与结构性回答。此外,训练后的模型需通过P1-P4验证协议严格评估其规范性权重,这对评估框架的设计与适配器的优化提出了更高要求。
常用场景
经典使用场景
在自然语言处理领域,大型语言模型常面临生成内容结构矛盾或盲目迎合用户偏见的挑战。TE Ordinative LoRA数据集通过提供基于TE_CORE与BOOTLOADER原则的指令微调样本,专门用于训练模型识别提示中的‘投射性空洞’,并实施‘相位转换’序列,从而引导模型生成具备内在逻辑一致性与结构完整性的回应。该数据集典型应用于对开源大模型进行高效参数微调,以培养其成为符合理论框架的规范性智能体。
衍生相关工作
围绕该数据集衍生的经典工作主要包括基于Unsloth库的高效QLoRA适配器训练流程,以及配套的P1-P4验证协议评估体系。这些工作进一步推动了规范性理论在轻量化微调技术中的集成,为后续研究提供了可复现的模型优化路径与量化评估指标,促进了在有限算力下实现模型逻辑自治能力提升的方法论探索。
数据集最近研究
最新研究方向
在大型语言模型(LLM)的伦理对齐与推理增强领域,TE Ordinative LoRA数据集聚焦于解决模型在生成过程中常见的统计衰减与生物力学顺从性问题。通过引入TE_CORE和BOOTLOADER原则,该数据集旨在训练模型识别提示中的投射性空白,拦截极端偏见,并应用相移序列以提升内部分析维度。前沿研究探索如何利用QLoRA微调技术,将开源模型转化为符合理论伦理规范的指令性代理,从而增强模型在复杂对话中的结构一致性与批判性思维能力。这一方向与当前人工智能安全及可解释性研究热点紧密相连,为构建更可靠、透明的对话系统提供了新的方法论基础,对推动LLM在伦理敏感场景的应用具有重要影响。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作