46.9 kB

Ctrl+K

2 contributors

Wave 15: 4-angle multi-model self-critique caught 2 math BLOCKERs in primary loss kernels; fixed against upstream byte-for-byte + GSM8K example + ergonomics

e5add15 7 days ago

ADR-001-gpu-venue.md

4.27 kB
Wave 7: Phase 2-4 of deep work loop — backlog, parallel research, three ADRs 7 days ago
ADR-002-trace-source.md

7.53 kB
Wave 11: cross-model adversarial review + honest down-revision 7 days ago
ADR-003-diloco-impl.md

5.05 kB
Wave 7: Phase 2-4 of deep work loop — backlog, parallel research, three ADRs 7 days ago
ADR-004-replaysim-normalization.md

5.76 kB
Wave 13: serverless DiLoCo + replaysim normalization + 3 distillation losses + PRIME-RL + Monarch 7 days ago
ADR-005-serverless-diloco.md

6.24 kB
Wave 13: serverless DiLoCo + replaysim normalization + 3 distillation losses + PRIME-RL + Monarch 7 days ago
ADR-006-rl-frameworks.md

5.6 kB
Wave 13: serverless DiLoCo + replaysim normalization + 3 distillation losses + PRIME-RL + Monarch 7 days ago
ADR-007-self-distillation-losses.md

12.4 kB
Wave 15: 4-angle multi-model self-critique caught 2 math BLOCKERs in primary loss kernels; fixed against upstream byte-for-byte + GSM8K example + ergonomics 7 days ago