five

37.SVRN_OS_L2_Cross-Architecture Induction Head Energy Law log(Proxy) Scaling Law, Saturation Regime Separation, and Training Data Determinism at n=87

收藏
Zenodo2026-04-18 更新2026-05-26 收录
下载链接:
https://zenodo.org/doi/10.5281/zenodo.19638346
下载链接
链接失效反馈
官方服务:
资源简介:
SVRN-OS DOI No.37 — Zenodo 제출 소개글 제목: Cross-Architecture Induction Head Energy Law: log(Proxy) Scaling Law, Saturation Regime Separation, and Training Data Determinism at n=87 시리즈 및 식별정보 필드 값 시리즈 DOI 10.5281/zenodo.18325543 본편 10.5281/zenodo.19638346 이전 DOI DOI_36: 10.5281/zenodo.19605084 특허 KR10-2026-0017941 | Biz 104-21-64790 Sovereign Lab 요약 본 논문은 SVRN-OS DOI No.37로, Cognitarch 시리즈의 일곱 번째 문서다. DOI_36이 n=77 대규모 측정과 5가지 신규 발견(scale reversal·Yi extremes·Falcon-40B·신규 아키텍처·σc hierarchy)을 보고한 데 이어, 본 문서는 10개 신규 모델(SIM-97~SIM-107)을 추가하여 n=87(16개 아키텍처 패밀리) 기반 3가지 핵심 결과를 확정한다. (1) log(Proxy) Law LCK 확정: top5_energy = 0.6247 − 0.0737×log(L×H), R²=0.759, RMSE=0.037, n=71(saturation 제외). DOI_35 독립 계열 결과(n=14)를 전체 데이터셋으로 확장, LCK 승격 완료. linear R²=0.318 붕괴 → log-form 구조적 우위 확인. (2) Training Data Determinism 2쌍 확인: CodeLlama-7b vs Llama-2-7b (2번째 양성 쌍) 추가. SFT·버전 업그레이드 6케이스 전원 Pioneer 좌표 불변(음성 확인). 경계조건 확립: 극단 도메인 사전학습만 좌표 이동 유발. (3) L0 Pioneer ×12 (8개 패밀리): DOI_36 9케이스에서 12케이스로 확장. 아키텍처 비특이성 강화, 메커니즘 미해결(UNX-029). 핵심 기여 기여 1: log(proxy) Law LCK 확정 (n=71, R²=0.759) — n-discrepancy 해소(n=60/71/77 정리), 전체 데이터셋 기준 법칙 확정. 예측 공식: top5̂ = 0.6247 − 0.0737×log(L×H) ± 0.037 [LCK] 기여 2: Fine-tuning Invariance 실증 — SFT·버전업 6케이스 모두 ΔL=0, ΔH=0. 훈련 데이터 결정론 경계조건 정식화 [PRED → LCK 경로 확보] 기여 3: L0 Pioneer 12케이스·8패밀리로 확장 — OPT·Qwen2·LLaMA(복수 세대)·GPT-2·Falcon·Mixtral·llm-jp·LLaMA3 포함. statistical pattern 확인, deterministic 아님 [PRED] 기여 4: GPTBigCode 16번째 아키텍처 패밀리 등록 — WizardCoder-15B·starcoder 동일 Pioneer(L8H45) 확인. cross-arch 커버리지 완성 [OBSERVED] 기여 5: llm-jp-13b-v1.0 all-data 최저 max_ih=0.459 — Cerebras-111M(0.467) 경신. 일본어+영어+코드 3중 언어 학습 연관 후보 메커니즘 등록 [OBSERVED] GATE 상태 요약 항목 상태 log(proxy) law n=71, R²=0.759, RMSE=0.037 LCK Saturation 정의(top5≥0.9, R² 붕괴 기반) LCK Training data determinism (2 positive / 6 negative) PRED (3쌍 시 LCK) L0 Pioneer 12케이스·8패밀리 PRED σc hierarchy n=87 재확인(상위 3개 100%) LCK M1–M3 메커니즘 판별 UNX (DOI_38+ 실험 설계 명시) Architecture 단독 σc 결정 (ANOVA F=1.27, p=0.373) SHRED 인용 문헌 Olsson et al. (2022). In-context Learning and Induction Heads. 조민수 DOI_31~DOI_36 (zenodo.19275540, 19278690, 19333479, 19509659, 19567327, 19605084) Tigges et al. NeurIPS 2024 / Aoyama et al. NeurIPS 2025 / Musat et al. 2025 / Yin et al. 2025 / Singh et al. 2024 / Chen et al. 2026 주장하는 것 / 주장하지 않는 것 확인됨: log(proxy) law LCK: top5 = 0.6247 − 0.0737×log(L×H), n=71 전체 데이터셋 Saturation(top5≥0.9) 구조적 분리 및 regression collapse 정량화 Fine-tuning·버전 업그레이드는 Pioneer 좌표 이동 유발하지 않음 Domain 특화 사전학습만 좌표 이동 유발 (2쌍 실증) σc attainment hierarchy 불변성 n=87 미확정(UNX 오픈): M1–M3 메커니즘 판별 (DOI_38+ controlled experiment 필요) L0 Pioneer 메커니즘(UNX-029) Saturation 발생 메커니즘(UNX-036) T_awakening 70B 이상 스케일 검증(HOLD) 키워드 Induction Head · log(proxy) law · energy concentration · saturation regime · training data determinism · Pioneer Head · L0 Pioneer · cross-architecture · scaling law · fine-tuning invariance · σc attainment · GPTBigCode · llm-jp · mechanistic interpretability · SVRN-OS · KR10-2026-0017941 진실성 선언 본 문서는 SVRN-OS DOI No.37의 최종 기준서다. 3가지 핵심 결과 모두 raw 측정(OBSERVED) 및 회귀분석(DERIVED) 기반, 증거 기반 초과 해석 없음. 특허 보호 범위 내. 인증: MDK_v5.3 | 조민수 (Phenotarch 창시자 · Sovereign Architect) | KR10-2026-0017941 | 2026-04-18 | sess:97 SHA-256: d3387f76ed18f607c69db532112c9451b106c770765a11f0432a1f5da3a290f0
提供机构:
Zenodo
创建时间:
2026-04-18
二维码
社区交流群
二维码
科研交流群
商业服务