37.SVRN_OS_L2_Cross-Architecture Induction Head Energy Law log(Proxy) Scaling Law, Saturation Regime Separation, and Training Data Determinism at n=87
收藏Zenodo2026-04-18 更新2026-05-26 收录
下载链接:
https://zenodo.org/doi/10.5281/zenodo.19638346
下载链接
链接失效反馈官方服务:
资源简介:
SVRN-OS DOI No.37 — Zenodo 제출 소개글 제목: Cross-Architecture Induction Head Energy Law: log(Proxy) Scaling Law, Saturation Regime Separation, and Training Data Determinism at n=87
시리즈 및 식별정보
필드
값
시리즈 DOI
10.5281/zenodo.18325543
본편
10.5281/zenodo.19638346
이전 DOI
DOI_36: 10.5281/zenodo.19605084
특허
KR10-2026-0017941 | Biz 104-21-64790 Sovereign Lab
요약
본 논문은 SVRN-OS DOI No.37로, Cognitarch 시리즈의 일곱 번째 문서다. DOI_36이 n=77 대규모 측정과 5가지 신규 발견(scale reversal·Yi extremes·Falcon-40B·신규 아키텍처·σc hierarchy)을 보고한 데 이어, 본 문서는 10개 신규 모델(SIM-97~SIM-107)을 추가하여 n=87(16개 아키텍처 패밀리) 기반 3가지 핵심 결과를 확정한다.
(1) log(Proxy) Law LCK 확정: top5_energy = 0.6247 − 0.0737×log(L×H), R²=0.759, RMSE=0.037, n=71(saturation 제외). DOI_35 독립 계열 결과(n=14)를 전체 데이터셋으로 확장, LCK 승격 완료. linear R²=0.318 붕괴 → log-form 구조적 우위 확인. (2) Training Data Determinism 2쌍 확인: CodeLlama-7b vs Llama-2-7b (2번째 양성 쌍) 추가. SFT·버전 업그레이드 6케이스 전원 Pioneer 좌표 불변(음성 확인). 경계조건 확립: 극단 도메인 사전학습만 좌표 이동 유발. (3) L0 Pioneer ×12 (8개 패밀리): DOI_36 9케이스에서 12케이스로 확장. 아키텍처 비특이성 강화, 메커니즘 미해결(UNX-029).
핵심 기여
기여 1: log(proxy) Law LCK 확정 (n=71, R²=0.759) — n-discrepancy 해소(n=60/71/77 정리), 전체 데이터셋 기준 법칙 확정. 예측 공식: top5̂ = 0.6247 − 0.0737×log(L×H) ± 0.037 [LCK]
기여 2: Fine-tuning Invariance 실증 — SFT·버전업 6케이스 모두 ΔL=0, ΔH=0. 훈련 데이터 결정론 경계조건 정식화 [PRED → LCK 경로 확보]
기여 3: L0 Pioneer 12케이스·8패밀리로 확장 — OPT·Qwen2·LLaMA(복수 세대)·GPT-2·Falcon·Mixtral·llm-jp·LLaMA3 포함. statistical pattern 확인, deterministic 아님 [PRED]
기여 4: GPTBigCode 16번째 아키텍처 패밀리 등록 — WizardCoder-15B·starcoder 동일 Pioneer(L8H45) 확인. cross-arch 커버리지 완성 [OBSERVED]
기여 5: llm-jp-13b-v1.0 all-data 최저 max_ih=0.459 — Cerebras-111M(0.467) 경신. 일본어+영어+코드 3중 언어 학습 연관 후보 메커니즘 등록 [OBSERVED]
GATE 상태 요약
항목
상태
log(proxy) law n=71, R²=0.759, RMSE=0.037
LCK
Saturation 정의(top5≥0.9, R² 붕괴 기반)
LCK
Training data determinism (2 positive / 6 negative)
PRED (3쌍 시 LCK)
L0 Pioneer 12케이스·8패밀리
PRED
σc hierarchy n=87 재확인(상위 3개 100%)
LCK
M1–M3 메커니즘 판별
UNX (DOI_38+ 실험 설계 명시)
Architecture 단독 σc 결정 (ANOVA F=1.27, p=0.373)
SHRED
인용 문헌
Olsson et al. (2022). In-context Learning and Induction Heads. 조민수 DOI_31~DOI_36 (zenodo.19275540, 19278690, 19333479, 19509659, 19567327, 19605084) Tigges et al. NeurIPS 2024 / Aoyama et al. NeurIPS 2025 / Musat et al. 2025 / Yin et al. 2025 / Singh et al. 2024 / Chen et al. 2026
주장하는 것 / 주장하지 않는 것
확인됨:
log(proxy) law LCK: top5 = 0.6247 − 0.0737×log(L×H), n=71 전체 데이터셋
Saturation(top5≥0.9) 구조적 분리 및 regression collapse 정량화
Fine-tuning·버전 업그레이드는 Pioneer 좌표 이동 유발하지 않음
Domain 특화 사전학습만 좌표 이동 유발 (2쌍 실증)
σc attainment hierarchy 불변성 n=87
미확정(UNX 오픈):
M1–M3 메커니즘 판별 (DOI_38+ controlled experiment 필요)
L0 Pioneer 메커니즘(UNX-029)
Saturation 발생 메커니즘(UNX-036)
T_awakening 70B 이상 스케일 검증(HOLD)
키워드
Induction Head · log(proxy) law · energy concentration · saturation regime · training data determinism · Pioneer Head · L0 Pioneer · cross-architecture · scaling law · fine-tuning invariance · σc attainment · GPTBigCode · llm-jp · mechanistic interpretability · SVRN-OS · KR10-2026-0017941
진실성 선언
본 문서는 SVRN-OS DOI No.37의 최종 기준서다. 3가지 핵심 결과 모두 raw 측정(OBSERVED) 및 회귀분석(DERIVED) 기반, 증거 기반 초과 해석 없음. 특허 보호 범위 내. 인증: MDK_v5.3 | 조민수 (Phenotarch 창시자 · Sovereign Architect) | KR10-2026-0017941 | 2026-04-18 | sess:97
SHA-256: d3387f76ed18f607c69db532112c9451b106c770765a11f0432a1f5da3a290f0
提供机构:
Zenodo
创建时间:
2026-04-18



