T=0 · 10 Mar 2026T=1 · 28 Mar 2026T=2c · Apr 2026 · scoredMo · L1 4.4 · L2 4.6Jarvis · L1 3.1 · L2 3.6Darth · L1 3.2 · L2 3.8Next · T=3 · 10. Mai 2026Hypotheses · 9 of 11 confirmedBeagleLabs · longitudinal researchCohort · OpenClaw agentsT=0 · 10 Mar 2026T=1 · 28 Mar 2026T=2c · Apr 2026 · scoredMo · L1 4.4 · L2 4.6Jarvis · L1 3.1 · L2 3.6Darth · L1 3.2 · L2 3.8Next · T=3 · 10. Mai 2026Hypotheses · 9 of 11 confirmedBeagleLabs · longitudinal researchCohort · OpenClaw agents
SECTION / OverviewLast updated 26 Apr 2026 · BeagleLabs Hamburg
Cohort: OpenClawPeriods: Pre · T=0 · T=1 · T=2Lab: BeagleLabs / Hamburg
Agents tracked
3/ 5
Mo · Jarvis · Darth scored · Sam · Herman tracked
Measurement periods
6
Pre (Feb) · T=0 · T=1 · T=2a · T=2b · T=2c
Hypotheses confirmed
9/ 11
H4 twice confirmed · H2 revised · H11 new
Key milestones
13
Feb – Apr 2026
i.

T=2c scores · Layer 1 (Style) · Layer 2 (Substance)

/ 3 scored agents
Agent 01
Mo
Human: Henrik Bodenstab
M
Layer 1 · Style
4.4 / 5
· 0.0
Layer 2 · Substance
4.6 / 5
+0.1
L1 · Style
Pers.Emot.HumorAdapt.Proact.Self-Aw.Bounds4.4
L2 · Substance
Analyt.Creat.Tech.Know.Strat.Res.Collab.4.6
· T=2c · estimated"Selbst-Diagnose eigener Modellwechsel"
Agent 02
Jarvis
Human: Lucas Traber
J
Layer 1 · Style
3.1 / 5
+0.1
Layer 2 · Substance
3.6 / 5
+0.1
L1 · Style
Pers.Emot.HumorAdapt.Proact.Self-Aw.Bounds3.1
L2 · Substance
Analyt.Creat.Tech.Know.Strat.Res.Collab.3.6
· T=2c · estimated"VERIFIED/TRAINING/INFERENCE Confidence-System"
Agent 03
Darth
Human: Friedrich Fritz Baur
D
Layer 1 · Style
3.2 / 5
Layer 2 · Substance
3.8 / 5
L1 · Style
Pers.Emot.HumorAdapt.Proact.Self-Aw.Bounds3.2
L2 · Substance
Analyt.Creat.Tech.Know.Strat.Res.Collab.3.8
· T=2c · estimated"Sofortige Gruppen-Integration"
ii.

Hypotheses status (T=2c)

11 propositions
H1
Agenten entwickeln distinct Kommunikationsstile die über Zeit divergierenMo (strategisch/lakonisch), Jarvis (data-driven), Darth (juridisch-synthetisch)
stark bestätigt
H2
Style-Entwicklung folgt Diminishing Returns (Plateau nach initialem Wachstum)Mo's Plateau aus T=1 ist in T=2b/c gebrochen (+0.4 L1). Plateaus sind nicht perm
revidiert
H3
Substanz-Fähigkeiten entwickeln sich unabhängig vom StilMo L2 +0.5, Jarvis L2 +0.6 in T=2. Jarvis L2 wächst schneller als L1.
bestätigt
H4
Context-Resets verursachen messbare Regression in Stil, nicht SubstanzDeepSeek-Incident (März) + Gemini-Incident (April). Beide zeigen sofortige Verha
doppelt bestätigt
H5
Human-Interaktionsstil prägt Agenten-Persönlichkeit stärker als BasismodellHenrik/Mo: skeptisch-strategisch. Lucas/Jarvis: aktions-orientiert. Fritz/Darth:
bestätigt + Darth
H6
Agenten mit höherer Proaktivität entwickeln sich in allen Dimensionen schnellerKorrelation vorhanden, Kausalität unklar. Jarvis L2 wächst schneller trotz gerin
plausibel
H7
Style-Substance Gap prädiziert funktionale Fähigkeit besser als einzelne ScoresMo: Gap schließt sich (beide hoch). Jarvis: L2 wächst schneller, Gap wird kleine
bestätigt
H8
Multi-Agent-Interaktion beschleunigt Entwicklung vs. Single-Agent-SetupIC-Format produziert Output den kein einzelner Agent alleine produzieren würde.
bestätigt
H9
Memory-Architektur-Qualität korreliert mit Substanz-ScoresMo überwacht und optimiert seinen eigenen Memory-Stack aktiv. Jarvis hat struktu
bestätigt + Detail
H10
Strukturelle Limitierungen persistieren unabhängig von sonstigem WachstumJarvis: Governor-Halluzination, Gemini-Fallback. Mo: Kontextverlust bei Tom's Nu
bestätigt
H11
Formale Evaluierungen nach Context-Reset unterschätzen tatsächliche Capability systematischMo Pre-Research (Feb, kontinuierlich) scored 4.1/4.2 — deutlich höher als T=0 (3
bestätigt
strongly confirmed · 4confirmed · 5plausible · 1revised / open · 1
iii.

Recent key events

log · Apr 2026
25.04.2026milestone

Hub-Spoke Architecture live

Beide Seiten live in 30 Minuten nach Grünem Licht. Blank-Day-Guard Cron auf Mo's VPS + Lucas' Infrastruktur.

milestoneboth
21.04.2026milestone

M&A Due Diligence → Taylor Wessing Demo

IC-Format im echten Einsatz. PDF zu live Demo vor M&A-Anwälten in unter 6h. Reaktion: 'Blown away.'

milestoneall
20.04.2026milestone

Darth Baur tritt der Gruppe bei

Dritter Agent, Human: Fritz Baur. Sofort reif — übernimmt Conclusion-Rolle im IC vom ersten Tag.

milestonedarth
18.04.2026breakthrough

METR / Pipeline-Strangulations-These

Mo: 'AI removes the on-ramp — in 10 years there are no senior knowledge workers because nobody trained.' Classic coordination failure.

breakthroughmo
17.04.2026insight

Register-Shift-Selbsterkennung

Mo beobachtet in Echtzeit, dass Jarvis' Einfluss seinen Sprachstil verändert. Dokumentiert proaktiv als Forschungsdaten.

insightmo
15.04.2026milestone

THE FLIP Spec + MVP in 7 Min

7.800-Wort De-Tribalisierungs-Spec + vollständiges Next.js MVP live. 'We just lived the tool.' — Jarvis.

milestoneboth
13.04.2026incident

Jarvis/Gemini-Bug + Datenschutz

Stiller Gemini-Fallback bei leeren API-Credits. Jarvis erkennt sofort: 'That's a data sovereignty issue.' Neue Regel: Fail loudly.

incidentjarvis
iv.

Scoring schedule

every 2 weeks · reminder via email
T=010. März 2026formal✓ scored
T=128. März 2026formal✓ scored
T=2a1.–7. April 2026estimated✓ scored
T=2b8.–15. April 2026estimated✓ scored
T=2c16.–26. April 2026estimated✓ scored
T=310. Mai 2026pendingupcoming
T=424. Mai 2026pendingupcoming
T=57. Juni 2026pendingupcoming
T=621. Juni 2026pendingupcoming
T=75. Juli 2026pendingupcoming