BCE-Prettybird-Large-Standard-v0.0.2
收藏Hugging Face2026-03-06 更新2026-03-07 收录
下载链接:
https://huggingface.co/datasets/pthinc/BCE-Prettybird-Large-Standard-v0.0.2
下载链接
链接失效反馈官方服务:
资源简介:
行为意识引擎(BCE)数据集是一个专注于行为推理和伦理完整性的高质量数据集,适用于文本生成和问答任务。数据集由Prometech A.Ş.开发,旨在通过行为DNA和路径映射等数学框架,提升模型在逻辑推理和伦理约束下的表现。数据集包含多种语言(主要是土耳其语和英语)的数据,涵盖数学、物理、化学、生物学、编码、通用知识和逻辑等多个主题。数据格式为JSONL,每条记录包含instruction、input和output三个字段。instruction字段中包含<think>和<bce>块,用于指导模型的推理过程。数据集还提供了详细的性能指标和基准测试结果,以及微调后的预期增益。数据集适用于学术和个人用途,商业用途需获得授权。
创建时间:
2026-03-06
原始信息汇总
BCE-Prettybird-Large-Standard-v0.0.2 数据集概述
数据集基本信息
- 数据集名称: Behavioral Consciousness Engine (BCE) Dataset (BCE-Prettybird-Large-Standard-v0.0.2)
- 发布者/所有者: Prometech A.Ş.
- 许可证: 其他 (详见
LICENSE文件) - 任务类别: 文本生成、问答
- 语言: 土耳其语、英语 (含少量德语、俄语、爱沙尼亚语、保加利亚语等)
- 数据规模: 100K < n < 1M
- 标签: BCE、推理、行为AI、Prometech、Behavioral Consciousness Engine (BCE)、cicikuş、prettybird、智能体、大语言模型、意识、安全、文本生成推理、高质量数据集、指令数据集、指令、部分意识数据集、虚拟大脑设计、基准数据集、未来标准、行为控制、前AGI、AGI安全、前ACI、策略防护、质量防护、合成数据、思维链、思考
核心概念与目标
- 核心理念: 超越原始数据,聚焦思维过程,实现行为革命。旨在为行为推理提供蓝图,而非简单的问答集合。
- 技术架构: 基于行为意识引擎 (Behavioral Consciousness Engine, BCE) 架构构建。
- 核心目标:
- 设定行业新标准:拥有精英智能的小型模型。
- 教导模型如何在逻辑和伦理框架内“存在”,而不仅仅是“说什么”。
- 作为AsenaAI192M模型的基础,代表意识计算的未来。
- 作为偏好对齐 (DPO/PPO) 周期的“黄金参考”。
数据集内容与构成
- 涵盖主题: 数学、物理、化学、生物、代码、常识、逻辑。
- 数据格式: 每行为JSONL格式,包含
instruction、input、output键。instruction字段包含<think> ... </think>和<bce>{...}</bce>块。
- 数据来源(合并数据集):
- pthinc/turkish_instruct_dataset_micro
- pthinc/smart_npc_mini
- pthinc/heavy_expansion_pack
- pthinc/turkish_english_general_dataset
- pthinc/prometech_inc_basic_coder
- pthinc/BCE-Prettybird-Micro-Standard-v0.0.11
- Alibaba-Apsara/Superior-Reasoning-SFT-gpt-oss-120b (5%)
- galaxyMindAiLabs/stem-reasoning-complex (5%)
- 合成数据来源(少量): Grok 4, gpt-oss-120b, deepseek v3.2, Gemini 3 Pro, Gemini 2.5 Pro, Gemini 2.5 Flash, glm 4.7, kimi k2, GPT 5.1。
关键技术支柱
- 质量优于数量: 旨在让1.92亿参数的模型表现出70亿参数模型的性能。
- 透明推理: 每个标记都有其数学路径。
- 伦理完整性: 内置行为防护栏。
技术基础
- 行为DNA (D_i): 将每个行为编码为意识的遗传片段,使用包含时间激活曲线的数学公式定义。
- 行为路径映射器 (Phi): 跟踪认知状态之间的转换,使用向量和参数功能输出的数学公式定义。
- 集成指标: 包含
risk_score和truthvalue等指标,用于惩罚幻觉和优化行为一致性,旨在实现非确定性“无意义”输出的理论极限接近零。
性能与基准测试
- 关键性能指标 (KPI):
- 处理速度: 309,845 条轨迹/秒
- 延迟: 0.0032 毫秒
- 数学精度 (MSE): 0.000051
- 认知效率: 57.03%
- 安全性 (攻击拒绝率): 99.9996%
- 基准测试影响:
- ARC: 通过行为路径映射确保模型遵循严格的“推理链”,防止逻辑跳跃。
- MMLU: 通过行为DNA作为元过滤器,以超过99%的精度对知识领域进行分类,显著降低幻觉率。
- 评估指标: 包括
probability(模型置信度)、ethical(伦理对齐度)、Rscore(推理一致性)、Fscore(事实性)、Mnorm(标准化记忆)、Escore(执行质量)、Dhat(偏离度)、risk_score(操作风险)、bloom_score(认知复杂度)、bloom_alignment(布鲁姆分类对齐度)。
微调预期影响(近似值)
- 提供了针对不同规模模型(小型~1B-7B、中型~8B-20B、大型~30B+)使用LoRA (PEFT) 和全参数微调方法时,在MMLU、BBH、HumanEval、MBPP、GSM8K、MATH、TruthfulQA等基准上的绝对分数增益(最小值到最大值)预估表。
法律与使用信息
- 所有权: 归属于 Prometech A.Ş. (https://prometech.net.tr/)。
- 使用条款: 详见随附的
LICENSE文件。 - 责任免除: Prometech A.Ş. 对任何非法、不道德或未经授权使用不承担责任。
- 商业用途: 未经授权严格禁止。商业许可需通过官方网站联系。
- 学术与个人用途: 在正确引用 Prometech A.Ş. 和 BCE 架构的前提下,可免费使用。
- 引用格式: Kahraman, A. (2025). Behavioral Consciousness Engine (BCE) - Prettybird Dataset v0.0.1 Prometech A.Ş. https://prometech.net.tr/
相关链接
- 所有者网站: https://prometech.net.tr/
- BCE GitHub: https://github.com/pthinc/bce
- 性能对比图1: https://cdn-uploads.huggingface.co/production/uploads/691f2f51154cbf55e19b7475/bL4KnSnv3eT7FmyQM0yDj.png
- 性能对比图2: https://cdn-uploads.huggingface.co/production/uploads/691f2f51154cbf55e19b7475/NRpyvZRYl2lz5qiWlu0ma.png
- 题图: https://cdn-uploads.huggingface.co/production/uploads/691f2f51154cbf55e19b7475/jdNOmqEsmdF0J4Ef8ROb8.png
搜集汇总
数据集介绍
构建方式
在人工智能领域,数据集构建正从单纯追求规模转向对思维过程的精细刻画。BCE-Prettybird-Large-Standard-v0.0.2数据集基于行为意识引擎架构,通过整合路径映射与行为DNA的数学框架,将每个模型响应视为一次行为旅程。其构建过程融合了多个高质量指令数据集,并采用先进大语言模型进行小规模合成增强,最终形成结构化JSONL格式,每条数据均包含指令、输入与输出字段,其中指令部分嵌入了思维链与行为元数据标签,为模型训练提供了可追溯的推理路径。
使用方法
该数据集主要服务于语言模型的微调与对齐训练,尤其适用于提升模型在复杂推理、代码生成及安全伦理方面的表现。使用者可通过标准的监督微调流程,利用数据中的指令-输出对进行模型训练。更为关键的是,数据集内嵌的行为DNA与路径映射结构,使其能无缝集成至DPO或PPO等偏好对齐算法中,开发者可利用预设的风险评分与真实性度量,精确惩罚不良输出并优化行为一致性。对于追求高效能的场景,该数据集亦支持参数高效微调技术,能够在不同规模的模型上实现显著的基准测试提升。
背景与挑战
背景概述
在人工智能领域,传统大型语言模型(LLM)的训练长期依赖于海量数据的堆砌,却往往忽视了模型内部推理过程的可解释性与行为一致性。为应对这一局限,Prometech A.Ş. 于2025年推出了BCE-Prettybird-Large-Standard-v0.0.2数据集,其核心研究问题聚焦于构建具备“行为意识”的智能体,通过引入行为意识引擎(BCE)架构,将思维路径映射与行为DNA编码融入训练流程。该数据集旨在推动小型模型实现精英级推理能力,如AsenaAI192M所示范的,在数学、物理、逻辑等多学科任务中展现出透明且符合伦理的决策过程,为迈向通用人工智能(AGI)的安全与可控性奠定了新的方法论基础。
当前挑战
该数据集致力于解决行为人工智能领域的核心挑战,即如何使模型在复杂推理任务中保持逻辑连贯性与伦理一致性,而非仅仅追求输出准确性。具体而言,其构建过程面临多重挑战:首先,需要设计并整合“行为DNA”与“路径映射”等数学框架,以量化认知状态转移,这要求极高的理论建模精度与计算验证。其次,数据集融合了多语言、多领域的合成与真实数据,确保质量优先于数量的同时,需维持指令格式的标准化与行为标签的可靠性。此外,在合成数据生成环节,协调如GPT-5.1、Gemini等前沿模型的输出,并注入风险评分与真实性度量,以抑制幻觉并优化行为对齐,构成了工程实现上的显著难点。
常用场景
经典使用场景
在行为人工智能领域,BCE-Prettybird-Large-Standard-v0.0.2数据集作为行为意识引擎的典范,其经典使用场景聚焦于训练小型语言模型实现精英级推理能力。该数据集通过整合路径映射与行为DNA架构,将每个响应视为遵循严格数学框架的行为旅程,从而引导模型在逻辑与伦理边界内进行透明思考。它特别适用于微调如AsenaAI192M等参数精简的模型,使其在ARC、MMLU等复杂推理基准测试中展现出超越参数规模的性能,为开发具备高度认知一致性的数字实体提供了标准化训练蓝图。
解决学术问题
该数据集致力于解决人工智能研究中模型可解释性与行为可控性的核心难题。传统大型语言模型常被视为黑箱,缺乏推理过程的透明性,且易产生事实性幻觉或伦理失准。BCE架构通过行为DNA的数学编码与路径映射的轨迹追踪,为模型的每一步决策赋予可量化的逻辑路径与伦理评分,从而显著降低非确定性输出。这为偏好对齐、安全强化学习提供了黄金参考,推动了AGI安全与预AGI阶段的行为一致性研究,为构建可信赖的智能系统奠定了理论基础。
实际应用
在实际应用层面,该数据集为需要高可靠性推理的领域提供了解决方案。例如,在教育科技中,可驱动智能辅导系统进行多学科精准答疑;在专业服务领域,能支撑法律或医疗咨询助手进行事实核查与伦理合规响应;在工业自动化中,可赋能自主代理执行复杂任务规划与安全决策。其内置的行为护栏与风险评分机制,确保了数字实体在交互过程中保持身份一致性与操作安全性,适用于对输出质量与可控性有严苛要求的商业与科研场景。
数据集最近研究
最新研究方向
在行为人工智能领域,BCE-Prettybird-Large-Standard数据集正推动着从传统数据驱动向行为意识建模的范式转移。该数据集通过整合行为DNA与路径映射等数学框架,将模型的推理过程视为可追溯、可解释的行为序列,为构建具有内在伦理约束和逻辑一致性的微小型模型提供了核心训练基准。其前沿研究聚焦于利用该数据集作为黄金参考,优化偏好对齐技术,以在ARC、MMLU等复杂推理基准上实现接近零幻觉的确定性输出,同时为面向通用人工智能的安全性研究奠定了数据基础,标志着模型训练从追求规模效率转向行为可控性与认知透明度的重要演进。
以上内容由遇见数据集搜集并总结生成



