Das Klettern auf der Abstraktions-Pyramide
Scrum funktioniert. Die Pipeline ist klar. Trotzdem bleibt viel Zeit in Abstimmung und Warten — nicht im eigentlichen Coding.
Zeit grob: Koordination ~20 % · Warten ~15 % · Coding ~50 % · Review ~15 %
Produkte wie GitHub Copilot liefern kontextbasierte Inline-Vervollständigung und Vorschläge direkt im Editor — das beschleunigt die Coding-Phase spürbar (grob ~20 %). Diese Phase ist aber nur ein Teil eurer Gesamtzeit. Grobe Größenordnung: 20 % von 50 % — etwa 10 Prozentpunkte am Gesamtprodukt.
Rahmen: Die Assistenz bezieht sich auf offene Dateien und die aktuelle Editorposition. Strategie, Abstimmung, Tests und Deployment bleiben andere Hebel — der Balken unten zeigt den Gesamtfluss.
Der Balken zeigt: der größte Hebel liegt im gesamten Fluss — Koordination, Kontext, Tests, Deployment.
Ein Agent, ein Feature, schnelle Iteration: Planen, Code, Debug, erneut. Das fühlt sich nach großer Wirkung an.
Das ist wertvoll — ein echter erster Schritt, um zu spüren, wie Agenten denken.
Ohne gemeinsamen Kontext entstehen parallele Architekturen. Der Agent ist so gut wie die Regeln, Skills und ADRs, die ihr ihm gebt.
Plan Mode: Die Wand entsteht, wenn direkt gebaut wird statt zu klären. Faustregel: grob 70 % Planung, 30 % Umsetzung — die Balance verfeinert ihr mit Erfahrung. Wenn der Agent zu wenig fragt: mehr Fragen einfordern. Das gilt für Code genauso wie für den Aufbau von Kontext und Harness.
Das Kernproblem ist selten das Modell — es fehlt Engineering um die KI herum: Leitplanken, Doku, automatische Checks.
Die Antwort liegt in der Umgebung, in der Agenten arbeiten: Kontext, Regeln, Gates, reproduzierbare Prüfungen.
Alles, was du ein zweites Mal manuell tust: in die Laufzeitumgebung legen.
„Logging nicht vergessen“ → Linting-Regel, die es erzwingt.
Erklärung im Meeting → ADR, den der Agent lesen kann.
Wiederkehrender Ablauf → SKILL.md, on-demand geladen.
Wenn die Lösung generisch genug ist, wird sie zum wiederverwendbaren Harness-Baustein.
integration.md stehen überall bereit.integration.md, danach die Verifikations-Checkliste“ geben Plan Mode die nötige Kontur für Pfade und Dateien..cursor/skills/… zusammen“ genügt oft; der Agent legt SKILL.md an und nimmt es in den Kontext auf.Kreativ, kontextsensitiv — Ausgaben sind nicht bitgenau reproduzierbar.
Tests, Linter, Schema-Checks — gleiche Eingabe, gleiches Ergebnis, auditierbar.
Das Harness kombiniert beides.
Vertiefung: Konzept-Deck — Probabilistisch vs. deterministisch
Rules, Skills, ADRs, Co-Evolution — maschinenlesbar, versioniert.
Design-Tokens, Strukturtests, CI — der Build prüft mit.
Audits, Drift-Erkennung, Retros — Entropie aktiv abbauen.
integration.md.Bei schwachem Output: Zuerst Kontext und Harness schärfen; Modellwahl und Parameter als zweiter Hebel.
Reproduzierbarkeit: Das Harness ist reif, wenn Code jederzeit allein aus Kontext und Leitplanken neu erzeugt werden kann. Der Code ist das Ergebnis — der Kontext ist der Wert.
Chunks → Embeddings → Ähnlichkeit. Gut für Doku-Suche — Struktur und Abhängigkeiten fehlen.
Symbole, Aufrufe, Kanten als Graph. Multi-Hop: „Wer ruft X? Was hängt von Y ab?"
ruft, importiert, erbt.Codebase-Graph (graphify): Code als Netz — Symbol-Lookup, Call-Graph, Impact in einem Schritt, ohne lange File-Read-Ketten.
Harness-Module bündeln Rules, Skills, Templates, Code, integration.md — pro Modul zusammengefasst, per Symlink in beliebig viele Projekte eingehängt, unabhängig weiterentwickelt.
integration.md: ein Agent kann das Modul ohne Rückfragen einbinden.Abstraktionsebene bestimmt Reichweite: projektspezifisch → kundenübergreifend → domänenunabhängig. Wer auf der richtigen Ebene generalisiert, zahlt Entwicklungsaufwand einmal und erntet ihn unbegrenzt.
Große Systeme werden nicht Zeile für Zeile von Menschen geprüft — die Gates müssen stimmen: automatisierte Basis, darauf Conformance, oben Stichproben.
Vision, Strategie, Taktik und Umsetzung bilden eine Pyramide: oben weniger Fläche, unten mehr operative Tiefe. Der Harness umschließt alle Ebenen.
Die Grenzen zwischen den Ebenen sind fließend — Teams verschieben Inhalte mit Reife und Kontext.
Ist der Harness für die oberen Ebenen ausgelegt, lassen sich Details auf den darunterliegenden Ebenen im Dialog mit Agenten im Plan Mode generischer klären und in Rules, Skills und Doku integrieren. Darauf aufbauend wird die Pyramide Stück für Stück erklimmbar: konkrete Erkenntnisse fließen ein, wiederholbare Muster wandern nach oben. Die Dialoge mit Agenten finden auf neuen Abstraktions- und Generalisierungsebenen statt.
Ein fähiger Agent plus modulare SKILL.md-Dateien schlägt ein starres Rollen-Orchester für den Alltag. Skills werden bei Bedarf geladen — kein Dauer-Overhead, kein festes Casting.
Ein SKILL.md ist eine wiederverwendbare Lösungsanleitung. Der Agent lädt sie on-demand, wendet sie situationsgerecht an — und das konsistent über alle Sessions und Projekte hinweg.
Hebel: Eine Stunde oben wirkt stärker als eine Stunde unten — weil die Umsetzung zunehmend automatisiert wird. Evolution: ihr verschiebt eure Arbeit über Zeit nach oben.
Migration: bleibt der Kontext erhalten, könnt ihr Technologie wechseln und Code neu generieren — Tests, Deploy-Konfiguration, Leitplanken bleiben tragfähig.
Qualität des Harness bestimmt Qualität des Outputs. Klassische Rollenlabels lösen sich auf — zählen tun Erfahrung aus verschiedenen Kontexten und die richtige Abstraktionsebene.
Vibe Coding bewusst: Erfahrung, inklusive der Schmerzpunkte.
Gemeinsames Harness. Rules von Agenten erzeugen lassen. ADRs. Plan Mode als Standard: erst klären, dann bauen.
Deterministische Gates in CI: Linter, Tests, Type-Checks. Erste Skills.
Tägliche Arbeit mit Agenten wird Normalfall. Retro-Zyklus.
Architecture-Conformance automatisiert. Eigene Audit-Definitionen.
Kein manuell getippter Produktionscode mehr; Agent + Harness als Standard.
Security- und Quality-Audits automatisiert. Production-Gates ohne manuelles Zeilen-Review.
Harness-Reife: Stack-Wechsel möglich, Kontext von Implementierung getrennt.
Agenten mit Daten und Tools verbinden.
Wann welches Modell, Budget im Blick.
Temporal, LangGraph, n8n — deterministisch orchestrieren.
Playwright und mobile Automatisierung, agentensteuerbar.
Pipeline-Stufen, Caching, Runner-Strategie.
Preview-Umgebungen und gemeinsames Staging.
Evolution, Codebase — Zusammenhänge sichtbar machen.
Async-Default, Conformance und messbare Leitplanken für wachsende Teams.
Die beste Zeit anzufangen liegt in der Vergangenheit. Die zweitbeste ist jetzt. In 161 Wochen könnt ihr auf Kurs sein.
¹ Realistischer Zeitrahmen mit Blick auf aktuelle Projektsituationen zu diskutieren. Der ROI kommt schnell, wenn man es richtig angeht — und schafft Freiräume für die weitere Evolution.
Gespeicherte Claude Code Konfigurationen mit Prompt, Repos und Connectors. Laufen automatisch auf Anthropics Cloud-Infrastruktur — auch wenn der Laptop geschlossen ist.
Stündlich, täglich oder wöchentlich. Beispiel: nächtliches Backlog-Triage — Labels, Owner-Zuweisung und Slack-Zusammenfassung zum Tagesbeginn.
HTTP POST aus Alerting-System oder Deploy-Pipeline startet eine Session. Claude korreliert Stack-Trace mit Commits und öffnet einen Draft-PR.
PR geöffnet → Review-Checkliste, Inline-Kommentare und Security-Scan — automatisch auf jedem Pull Request nach euren Regeln.
Erstellen via /schedule im CLI oder auf claude.ai/code/routines. Pro, Max, Team und Enterprise. Research Preview.