5. April 2026 KI & Automatisierung

Dark Factory: Wenn KI den Code schreibt und das Licht ausgeht

Simon Willison prognostiziert die Dark Factory — vollautomatisierte Software-Entwicklung ohne Menschen. Was dran ist, wo es heute schon funktioniert und warum du trotzdem nicht überflüssig wirst.

#Dark Factory
#KI Coding
#Vibe Coding
#Simon Willison
#Automatisierung
#Softwareentwicklung
#AI Agents
#Coding Agents

Die Idee ist so simpel wie radikal: Eine Fabrik, in der das Licht ausgeschaltet werden kann — weil kein Mensch mehr drin ist. Was in der Fertigung schon Realität ist (Toyota hat solche Linien seit den 90ern), wird jetzt auf die Softwareentwicklung übertragen. Django-Co-Creator Simon Willison hat den Begriff „Dark Factory” auf die KI-gestützte Programmierung angewandt und damit eine Debatte ausgelöst, die unsere Branche in den nächsten Monaten bestimmen wird.

Und ich muss zugeben: Nachdem ich die letzten Wochen intensiv mit Coding-Agenten gearbeitet habe, kann ich seine Argumentation besser nachvollziehen als mir lieb ist.

Was ist eine Dark Factory genau?

Der Begriff stammt aus der Fertigungsindustrie. Eine Dark Factory (auch Lights-Out Manufacturing) ist eine Produktionsstätte, die so vollständig automatisiert ist, dass sie ohne menschliche Anwesenheit läuft. Kein Licht nötig, keine Heizung, keine Pausenräume.

Übertragen auf die Softwareentwicklung bedeutet das: KI-Agenten übernehmen den gesamten Entwicklungszyklus — vom Schreiben des Codes über das Testen bis zum Deployment. Kein Mensch schaut sich den Code an. Kein Mensch reviewed Pull Requests. Kein Mensch debuggt.

Klingt dystopisch? Simon Willison beschreibt das als natürliche Evolution dessen, was wir gerade erleben:

Phase 1 (2024): KI als Autocomplete — Copilot ergänzt einzelne Zeilen
Phase 2 (2025): KI als Pair-Programmer — Cursor & Co. schreiben ganze Funktionen
Phase 3 (Anfang 2026): KI als autonomer Entwickler — Claude Code, Cursor 3 und Co. arbeiten eigenständig an Features
Phase 4 (ab Mitte 2026?): Dark Factory — kein Mensch berührt den Code mehr

Wir stecken gerade tief in Phase 3 und die Übergänge verschwimmen bereits.

95 Prozent KI-generierter Code — und das ist keine Übertreibung

Willison selbst gibt an, dass er mittlerweile 95 % seines Codes via KI generiert, ohne ihn selbst zu tippen. Teilweise vom Smartphone aus. Er nutzt dafür Patterns wie Red-Green-TDD (Test-Driven Development), bei dem die KI sowohl Tests als auch Implementierung schreibt und sich quasi selbst überprüft.

Das erste Unternehmen, das öffentlich von einer Dark-Factory-Implementierung spricht, ist StrongDM: Sie bauen bereits Software, bei der sich kein Mensch den KI-generierten Code ansieht.

Klingt verrückt? Vor zwei Jahren hätte ich das auch gesagt. Aber wenn ich mir anschaue, wie ich heute arbeite, ist der Weg dahin kürzer als gedacht:

Ich beschreibe ein Feature in natürlicher Sprache
Der Agent plant die Architektur, schreibt den Code und die Tests
Ich reviewe das Ergebnis — aber ehrlich gesagt: Bei Standardaufgaben scrolle ich mittlerweile nur noch drüber

Der Schritt von „ich scrolle drüber” zu „ich schaue gar nicht mehr hin” ist technisch gesehen trivial. Die Frage ist nur: Sollten wir ihn gehen?

Wo die Dark Factory heute schon funktioniert

Seien wir ehrlich: Für bestimmte Aufgaben ist die Dark Factory schon Realität, auch wenn wir sie nicht so nennen:

Standardisierte CRUD-Anwendungen

Wer noch manuell Formularvalidierung, Datenbankmodelle und REST-APIs für eine Kontaktverwaltung schreibt, verschwendet Zeit. Tools wie Vibe Coding machen das seit Monaten schneller und zuverlässiger als die meisten Junior-Entwickler.

Boilerplate und Konfiguration

Docker-Compose-Dateien, CI/CD-Pipelines, Webpack-Konfigurationen — alles Bereiche, in denen KI-Agenten konstant gute Ergebnisse liefern. Nicht weil die Aufgabe einfach ist, sondern weil sie hochgradig pattern-basiert ist.

Test-Generierung

Ironischerweise sind KI-Agenten besonders gut darin, Tests zu schreiben — genau die Aufgabe, die Entwickler am liebsten skippen. Wer KI-gestütztes Testing schon nutzt, weiß: Die Coverage steigt, die Bugs fallen.

Prototyping und MVPs

Für Proof-of-Concepts und erste Iterationen ist menschliches Code-Review oft Overkill. Wenn die Anwendung nach einer Woche sowieso weggeworfen wird, braucht niemand Clean Code.

Wo sie grandios scheitert

Aber hier wird es spannend — denn die Realität sieht anders aus als die Keynote-Demos:

Die Kosten-Explosion im Hintergrund

Was kaum jemand öffentlich diskutiert: KI-Agenten in Produktion verursachen spektakuläre Fehlkosten, wenn sie ohne Aufsicht laufen:

Ein Coding-Agent, der in eine Retry-Schleife geriet: 4.200 Dollar in drei Stunden
Fan-Out-Verarbeitung ohne Task-Limits: 12.400 Dollar an einem Wochenende
20 parallele Agenten mit Race Condition auf einem Budget-Counter: 3.200 Dollar durch 6,4-fache Überschreitung
Ein Support-Agent, der falsche E-Mails verschickte: 1,40 Dollar Token-Kosten, aber 50.000+ Dollar verlorenes Business

Das sind keine hypothetischen Szenarien — das sind dokumentierte Vorfälle. Die Benchmark-Mirage, die ich im März beschrieben habe, zeigt sich hier in voller Pracht: Was in der Demo funktioniert, explodiert in der Produktion.

Multi-Agent-Koordination ist ein ungelöstes Problem

Die UC Berkeley MAST-Studie zeigt 41 bis 87 Prozent Failure-Rates bei Multi-Agent-Koordination. Wenn ein Agent scheitert, ist das ärgerlich. Wenn mehrere Agenten gleichzeitig scheitern und sich gegenseitig beeinflussen, entsteht ein 17-facher Fehler-Verstärker.

Das ist der Grund, warum Harness Engineering so wichtig wird: Ohne den richtigen Rahmen sind autonome Agenten wie ein Auto ohne Bremsen — beeindruckend schnell, bis zur ersten Kurve.

Die Technical-Debt-Zeitbombe

Der aktuelle DORA-Report bestätigt, was ich letzte Woche analysiert habe: 40 Prozent des Codes ist bereits KI-generiert — aber die Delivery-Geschwindigkeit sinkt trotzdem. Der Grund: KI-Code sieht gut aus, kompiliert, besteht Tests — und erzeugt trotzdem eine neue Form von Technical Debt, die erst Monate später sichtbar wird.

In einer Dark Factory, in der niemand den Code liest, wird diese Zeitbombe zum existenziellen Risiko.

Die Vertrauensfrage: Das eigentliche Problem

Die technischen Probleme sind lösbar. Budget-Gates, Action-Limits, bessere Evaluatoren — das alles kommt. Das fundamentale Problem ist ein anderes: Vertrauen.

Wann vertraust du einem System so weit, dass du nicht mehr hinschaust?

In der klassischen Fertigung hat diese Frage klare Antworten: Wenn die Qualitätskontrolle automatisiert ist, wenn die Fehlerrate unter einem definierten Schwellenwert liegt, wenn die Kosten eines Fehlers kalkulierbar sind.

In der Software ist das anders:

Die Fehlerräume sind unbegrenzt (im Gegensatz zu physischen Teilen)
Die Qualitätskontrolle (Tests) wird vom selben System geschrieben wie der Code
Die Konsequenzen eines Fehlers sind oft nicht vorhersagbar

Willison selbst warnt vor einem „KI-Challenger-Moment” — einer Katastrophe, die durch blinde Automatisierung ausgelöst wird, analog zum Space-Shuttle-Unglück, wo bekannte Risiken ignoriert wurden, weil das System „bisher immer funktioniert hat”.

Die 67.000 offenen Stellen, die keiner erklären kann

Hier kommt die ironische Pointe: Während alle über die Dark Factory diskutieren, boomen die Entwickler-Jobs. Über 67.000 offene Software-Engineering-Stellen bei Tech-Firmen in 2026 — ein Plus von 30 Prozent seit Jahresbeginn und doppelt so viele wie Mitte 2023.

Wie passt das zusammen? Meine Theorie: KI macht Entwicklung nicht billiger — sie macht mehr Entwicklung möglich. Projekte, die vorher zu teuer oder zu komplex waren, werden plötzlich machbar. Die Gesamtnachfrage nach Software steigt schneller als die Produktivitätsgewinne durch KI.

Das ist der gleiche Effekt, den wir bei der Einführung von Cloud Computing, Containerisierung und CI/CD gesehen haben: Jede Produktivitätssteigerung wurde durch explodierende Nachfrage überkompensiert.

Meine Prognose: Dark Factory ja, aber nicht so wie gedacht

Ich glaube, die Dark Factory kommt. Aber nicht als Ersatz für Entwickler, sondern als neue Schicht im Tech-Stack:

Kurzfristig (2026)

Dark-Factory-Muster für Boilerplate, Tests und standardisierte Komponenten
Menschliches Review für Architektur, Business-Logik und Security
Observability-Tools als Pflicht für jeden KI-generierten Code-Pfad

Mittelfristig (2027-2028)

Spezialisierte Dark-Factory-Pipelines für definierte Domänen (E-Commerce, CRUD, Landing Pages)
Menschen als „Architekten” und „Evaluatoren”, nicht als „Codierer”
Die Unterscheidung „KI-Code vs. Mensch-Code” wird irrelevant — alles wird hybrid

Langfristig

Softwareentwicklung wird zu einer Design-Disziplin: Du beschreibst Was und Warum, die Maschine liefert das Wie
Der „10x Engineer” wird zum „100x Architect”
Die Dark Factory ist der Normalfall für Implementation, menschliche Kreativität ist der Engpass

Was du jetzt tun solltest

Willison hat eine Prognose, die ich für realistisch halte: Bis Ende 2026 werden 50 Prozent der Ingenieure 95 Prozent ihres Codes via KI generieren. Wenn du nicht dazugehören willst, wirst du abgehängt. Wenn du nur dazugehören willst, bist du ersetzbar.

Der Sweet Spot liegt dazwischen:

Lerne, Agenten zu steuern — Prompt Engineering ist kein Nice-to-have mehr, sondern Kernkompetenz
Verstehe die Risiken — OWASP Top 10 für Agentic Applications sollte Pflichtlektüre sein
Investiere in Architektur — Die Fähigkeit, Systeme zu designen, die KI-Agenten effektiv nutzen können, wird zum Karriere-Differentiator
Behalte den Überblick — Dark Factory bedeutet nicht „kein Mensch involviert”. Es bedeutet „kein Mensch im Loop für die Ausführung”. Der Mensch bleibt für Strategie, Architektur und Urteilsvermögen

Die Dark Factory kommt nicht über Nacht. Sie kommt schleichend, Aufgabe für Aufgabe, Feature für Feature. Die Frage ist nicht ob, sondern wie schnell — und ob du auf der steuerenden oder der gesteuerten Seite stehst.

Ich schreibe hier regelmäßig über KI-Agenten, Automatisierung und Webentwicklung aus der Praxis. Wenn du keinen Post verpassen willst, schau öfter vorbei — oder folge mir auf den üblichen Kanälen.

Kann dein Unternehmen von KI-Automation profitieren?

Die meisten Teams verschenken Stunden pro Woche an Aufgaben, die KI längst übernehmen könnte. Lass uns gemeinsam herausfinden, wo bei dir das größte Potenzial liegt.

Kostenlos beraten lassen