Claude for Everyone · Nürnberg

When building stops being the bottleneck.

KI baut Software schneller als je zuvor. Der Engpass verschwindet nicht. Er zieht um. Vom Bauen zum Prüfen.

Fünf Kapitel

01
Der Flip
02
Wie es aussieht
03
Die Falle
04
Der Check
05
Der Mensch

Wer hat diese Woche etwas rausgeschickt, das er nicht ganz gelesen hat?

01
Der Flip
The flip

Bauen wurde billig.
Prüfen nicht.

Sonar · State of Code 2026 · 1.149 Entwickler
96%
vertrauen dem KI-Code nicht voll.
42 % des committed Codes sind schon KI-generiert, in Richtung 65 % bis 2027.
Geprüft wird trotzdem von Hand.
Sonars eigenes Wort dafür:verification bottleneck
Quelle: Sonar, State of Code 2026
humans are becoming verifiers.
Naval Ravikant
02
Wie es aussieht
What it looks like
Es trifft beide Enden
KONZERN
dasselbe Problem
EINE PERSON
Dasselbe Problem. Nur die Skalierung ist anders.
Konkret sieht es so aus
Spotify
76% mehr Pull Requests, seit der Agent baut.
coding is no longer the constraint
Shopify
Jeder achte Pull Request kommt vom Agenten.
im Slack, für alle sichtbar
Anthropic
Über 80 % des Codes, der in Produktion geht, baut der Agent.
intern gemessen
Quellen: Spotify Engineering · Shopify Engineering · Anthropic · 2026

Zwei Leute. Zwei Monate.
Sieben Produkte.

Zwei erfahrene Entwickler. Mit Agenten bauen sie wie ein Team von zwanzig. Der Engpass ist nicht das Können, sondern das Prüfen.

03
Die Falle
The trap
Output gegen Prüfkapazität
ab hier reißt es auf Output Prüfkapazität Mensch Zeit →

Nicht das Bauen wird knapp. Das Prüfen wird knapp.

Quellen: Faros AI · LinearB · CircleCI · CodeRabbit · METR
Die zwei naheliegenden Auswege
Mehr Menschen
funktioniert nicht
Linear und teuer. Der Output ist exponentiell.
Mehr Agenten
funktioniert nicht
Ein Test prüft, ob der Code macht, was dasteht. Nicht, ob dasteht, was gemeint war.

Beide Wege enden hier.

04
Der Check
Build the check

Drei Wege, den Check zu bauen.

01Test zuerst
Bei Neuem. Der Test kommt vor dem Code. Der Test ist die Spezifikation. Bekannt als test-driven development, TDD.
Ein Kauf-Button soll auf die Bestellseite führen. Test zuerst: Klick, landet man dort? Der Code muss ihn bestehen.

Drei Wege, den Check zu bauen.

01Test zuerst
Bei Neuem. Der Test kommt vor dem Code. Der Test ist die Spezifikation. Bekannt als test-driven development, TDD.
Ein Kauf-Button soll auf die Bestellseite führen. Test zuerst: Klick, landet man dort? Der Code muss ihn bestehen.
02Tests nachziehen
Bei Bestehendem. Auch bei 50.000 Modulen, Stück für Stück.
Nichts muss perfekt sein. Modul für Modul absichern, im laufenden Betrieb.

Drei Wege, den Check zu bauen.

01Test zuerst
Bei Neuem. Der Test kommt vor dem Code. Der Test ist die Spezifikation. Bekannt als test-driven development, TDD.
Ein Kauf-Button soll auf die Bestellseite führen. Test zuerst: Klick, landet man dort? Der Code muss ihn bestehen.
02Tests nachziehen
Bei Bestehendem. Auch bei 50.000 Modulen, Stück für Stück.
Nichts muss perfekt sein. Modul für Modul absichern, im laufenden Betrieb.
03Von außen prüfen
Beim laufenden Produkt. Ein Agent klickt durch die Oberfläche.
Egal was dahinter liegt. Geprüft wird, was der Mensch sieht.
we write the evaluators
that give us confidence.
Guillermo Rauch
Vercel
05
Der Mensch
Decide the human

Nicht: Mensch, ja oder nein.
Sondern: wie viel Mensch,
an welcher Stelle.

Zwei EbenenDas Dach bleibt. Der Regler wird pro Aktion gesetzt.

human in command
Der Mensch setzt Mandat und Schwellen vorab. Und trägt das Ergebnis.
reversibellockerirreversibeleng
delegiert
Läuft im Mandat. Höchstens danach geprüft.
z. B. Newsletter-Betreffzeilen testen
on the loop
Beobachten. Stichprobe.
z. B. Kundenmails beantworten, stichprobenartig geprüft
in the loop
Jede Aktion vorher freigeben.
z. B. eine Kündigung im HR-System bestätigen
Der Fahrplan
human in command setzt das Mandat vorab. trägt das Ergebnis. Umkehrbar? reversibel irreversibel Fehler sichtbar? befristet reversibel nur im Zeitfenster Großer Schaden? ja nein nein ja delegiert läuft, danach geprüft on the loop beobachten, Stichprobe in the loop vorher freigeben Sonderfälle wie Regulatorik oder Compliance können das überstimmen.

Mehr Mensch
ist nicht besser.

Auf das Risiko abgestimmt.
Zu viel Kontrolle erstickt das Tempo.
Zu wenig ist fahrlässig.

Neu · seit dem 23. Juni

Claude Tag.
Ein Agent, getaggt mit @Claude in Slack.

Der Regler ist schon eingebaut. Wohin er gestellt wird, beantwortet kein Tool.

Jetzt dürft ihr sortieren.

Drei Aktionen. Wohin mit dem Regler?

delegiert on the loop in the loop locker eng
Eine Rechnung bezahlen
delegiert on the loop in the loop locker eng
Eine Rechnung bezahlen
delegiert on the loop in the loop locker eng
Auflösung
Irreversibel. Großer Schaden. in the loop.
delegiert on the loop in the loop locker eng
Firmenpost veröffentlichen
delegiert on the loop in the loop locker eng
Firmenpost veröffentlichen
delegiert on the loop in the loop locker eng
Auflösung
Sichtbar, Screenshots bleiben. Reputationsrisiko. on the loop.
delegiert on the loop in the loop locker eng
Meetingnotizen ablegen
delegiert on the loop in the loop locker eng
Meetingnotizen ablegen
delegiert on the loop in the loop locker eng
Auflösung
Sieht nach delegiert aus. Flüsterpost-Effekt. on the loop.
delegiert on the loop in the loop locker eng

Es ist kein Schalter.

Die Uneinigkeit ist der Inhalt.
Ein fehlerhafter Deploy geht live an alle Nutzer.
Schwer zurückzuholen.
delegiert on the loop in the loop locker eng
Ein fehlerhafter Deploy geht live an alle Nutzer.
Schwer zurückzuholen.
delegiert on the loop in the loop locker eng
Feature Flag.
Canary auf 1 Prozent.
Sofortiges Rollback. Reversibel bis zum Scharfschalten. on the loop.
delegiert on the loop in the loop locker eng
Kanarienvogel

Der Engpass verschwindet nicht.
Er zieht um. Vom Bauen zum Prüfen.
Die Frage ist nicht mehr, wie schnell wir bauen,
sondern wo der Mensch im Loop bleibt.

Zum Schluss

Ein Satz.

Was bleibt hängen?

z. B. „Der Engpass zieht vom Bauen zum Prüfen um.“

1 MinuteAufschreiben. Dann dem Nachbarn vorlesen. Einfach teilen.
Danke.
Isabell Haaf · isabellhaaf.com

Wer am Prüf-Engpass hängt und einmal durch den eigenen Regler schauen will: gerne eine Nachricht auf LinkedIn. Auch fürs Deck oder Handout.

Quellen · Sources
01Sonar, State of Code 2026. 1.149 Entwickler.
02Naval Podcast, „The AI Industrial Revolution“, 1. Juni 2026. Naval Ravikant, Guillermo Rauch.
03Spotify Engineering, „Coding Is No Longer the Constraint“, Juni 2026.
04Shopify Engineering, „Under the River“, 2026.
05Anthropic, „When AI builds itself“, Anthropic Institute, 5. Juni 2026.
06Faros AI, AI Engineering Report 2025 und 2026 („The Acceleration Whiplash“).
07LinearB, 2026 Software Engineering Benchmarks Report.
08CircleCI, 2026 State of Software Delivery.
09CodeRabbit, State of AI vs Human Code Generation Report, Dezember 2025.
10METR, Measuring the Impact of Early-2025 AI on Experienced Open-Source Developer Productivity, Juli 2025.
11Anthropic, Claude Tag, Ankündigung 23. Juni 2026.
Pfeiltasten blättern · F für Vollbild