Dark Factory: Wenn KI den Code schreibt und das Licht ausgeht
Simon Willison prognostiziert die Dark Factory — vollautomatisierte Software-Entwicklung ohne Menschen. Was dran ist, wo es heute schon funktioniert und warum du trotzdem nicht überflüssig wirst.
Die Idee ist so simpel wie radikal: Eine Fabrik, in der das Licht ausgeschaltet werden kann — weil kein Mensch mehr drin ist. Was in der Fertigung schon Realität ist (Toyota hat solche Linien seit den 90ern), wird jetzt auf die Softwareentwicklung übertragen. Django-Co-Creator Simon Willison hat den Begriff „Dark Factory” auf die KI-gestützte Programmierung angewandt und damit eine Debatte ausgelöst, die unsere Branche in den nächsten Monaten bestimmen wird.
Und ich muss zugeben: Nachdem ich die letzten Wochen intensiv mit Coding-Agenten gearbeitet habe, kann ich seine Argumentation besser nachvollziehen als mir lieb ist.
Was ist eine Dark Factory genau?
Der Begriff stammt aus der Fertigungsindustrie. Eine Dark Factory (auch Lights-Out Manufacturing) ist eine Produktionsstätte, die so vollständig automatisiert ist, dass sie ohne menschliche Anwesenheit läuft. Kein Licht nötig, keine Heizung, keine Pausenräume.
Übertragen auf die Softwareentwicklung bedeutet das: KI-Agenten übernehmen den gesamten Entwicklungszyklus — vom Schreiben des Codes über das Testen bis zum Deployment. Kein Mensch schaut sich den Code an. Kein Mensch reviewed Pull Requests. Kein Mensch debuggt.
Klingt dystopisch? Simon Willison beschreibt das als natürliche Evolution dessen, was wir gerade erleben:
- Phase 1 (2024): KI als Autocomplete — Copilot ergänzt einzelne Zeilen
- Phase 2 (2025): KI als Pair-Programmer — Cursor & Co. schreiben ganze Funktionen
- Phase 3 (Anfang 2026): KI als autonomer Entwickler — Claude Code, Cursor 3 und Co. arbeiten eigenständig an Features
- Phase 4 (ab Mitte 2026?): Dark Factory — kein Mensch berührt den Code mehr
Wir stecken gerade tief in Phase 3 und die Übergänge verschwimmen bereits.
95 Prozent KI-generierter Code — und das ist keine Übertreibung
Willison selbst gibt an, dass er mittlerweile 95 % seines Codes via KI generiert, ohne ihn selbst zu tippen. Teilweise vom Smartphone aus. Er nutzt dafür Patterns wie Red-Green-TDD (Test-Driven Development), bei dem die KI sowohl Tests als auch Implementierung schreibt und sich quasi selbst überprüft.
Das erste Unternehmen, das öffentlich von einer Dark-Factory-Implementierung spricht, ist StrongDM: Sie bauen bereits Software, bei der sich kein Mensch den KI-generierten Code ansieht.
Klingt verrückt? Vor zwei Jahren hätte ich das auch gesagt. Aber wenn ich mir anschaue, wie ich heute arbeite, ist der Weg dahin kürzer als gedacht:
- Ich beschreibe ein Feature in natürlicher Sprache
- Der Agent plant die Architektur, schreibt den Code und die Tests
- Ich reviewe das Ergebnis — aber ehrlich gesagt: Bei Standardaufgaben scrolle ich mittlerweile nur noch drüber
Der Schritt von „ich scrolle drüber” zu „ich schaue gar nicht mehr hin” ist technisch gesehen trivial. Die Frage ist nur: Sollten wir ihn gehen?
Wo die Dark Factory heute schon funktioniert
Seien wir ehrlich: Für bestimmte Aufgaben ist die Dark Factory schon Realität, auch wenn wir sie nicht so nennen:
Standardisierte CRUD-Anwendungen
Wer noch manuell Formularvalidierung, Datenbankmodelle und REST-APIs für eine Kontaktverwaltung schreibt, verschwendet Zeit. Tools wie Vibe Coding machen das seit Monaten schneller und zuverlässiger als die meisten Junior-Entwickler.
Boilerplate und Konfiguration
Docker-Compose-Dateien, CI/CD-Pipelines, Webpack-Konfigurationen — alles Bereiche, in denen KI-Agenten konstant gute Ergebnisse liefern. Nicht weil die Aufgabe einfach ist, sondern weil sie hochgradig pattern-basiert ist.
Test-Generierung
Ironischerweise sind KI-Agenten besonders gut darin, Tests zu schreiben — genau die Aufgabe, die Entwickler am liebsten skippen. Wer KI-gestütztes Testing schon nutzt, weiß: Die Coverage steigt, die Bugs fallen.
Prototyping und MVPs
Für Proof-of-Concepts und erste Iterationen ist menschliches Code-Review oft Overkill. Wenn die Anwendung nach einer Woche sowieso weggeworfen wird, braucht niemand Clean Code.
Wo sie grandios scheitert
Aber hier wird es spannend — denn die Realität sieht anders aus als die Keynote-Demos:
Die Kosten-Explosion im Hintergrund
Was kaum jemand öffentlich diskutiert: KI-Agenten in Produktion verursachen spektakuläre Fehlkosten, wenn sie ohne Aufsicht laufen:
- Ein Coding-Agent, der in eine Retry-Schleife geriet: 4.200 Dollar in drei Stunden
- Fan-Out-Verarbeitung ohne Task-Limits: 12.400 Dollar an einem Wochenende
- 20 parallele Agenten mit Race Condition auf einem Budget-Counter: 3.200 Dollar durch 6,4-fache Überschreitung
- Ein Support-Agent, der falsche E-Mails verschickte: 1,40 Dollar Token-Kosten, aber 50.000+ Dollar verlorenes Business
Das sind keine hypothetischen Szenarien — das sind dokumentierte Vorfälle. Die Benchmark-Mirage, die ich im März beschrieben habe, zeigt sich hier in voller Pracht: Was in der Demo funktioniert, explodiert in der Produktion.
Multi-Agent-Koordination ist ein ungelöstes Problem
Die UC Berkeley MAST-Studie zeigt 41 bis 87 Prozent Failure-Rates bei Multi-Agent-Koordination. Wenn ein Agent scheitert, ist das ärgerlich. Wenn mehrere Agenten gleichzeitig scheitern und sich gegenseitig beeinflussen, entsteht ein 17-facher Fehler-Verstärker.
Das ist der Grund, warum Harness Engineering so wichtig wird: Ohne den richtigen Rahmen sind autonome Agenten wie ein Auto ohne Bremsen — beeindruckend schnell, bis zur ersten Kurve.
Die Technical-Debt-Zeitbombe
Der aktuelle DORA-Report bestätigt, was ich letzte Woche analysiert habe: 40 Prozent des Codes ist bereits KI-generiert — aber die Delivery-Geschwindigkeit sinkt trotzdem. Der Grund: KI-Code sieht gut aus, kompiliert, besteht Tests — und erzeugt trotzdem eine neue Form von Technical Debt, die erst Monate später sichtbar wird.
In einer Dark Factory, in der niemand den Code liest, wird diese Zeitbombe zum existenziellen Risiko.
Die Vertrauensfrage: Das eigentliche Problem
Die technischen Probleme sind lösbar. Budget-Gates, Action-Limits, bessere Evaluatoren — das alles kommt. Das fundamentale Problem ist ein anderes: Vertrauen.
Wann vertraust du einem System so weit, dass du nicht mehr hinschaust?
In der klassischen Fertigung hat diese Frage klare Antworten: Wenn die Qualitätskontrolle automatisiert ist, wenn die Fehlerrate unter einem definierten Schwellenwert liegt, wenn die Kosten eines Fehlers kalkulierbar sind.
In der Software ist das anders:
- Die Fehlerräume sind unbegrenzt (im Gegensatz zu physischen Teilen)
- Die Qualitätskontrolle (Tests) wird vom selben System geschrieben wie der Code
- Die Konsequenzen eines Fehlers sind oft nicht vorhersagbar
Willison selbst warnt vor einem „KI-Challenger-Moment” — einer Katastrophe, die durch blinde Automatisierung ausgelöst wird, analog zum Space-Shuttle-Unglück, wo bekannte Risiken ignoriert wurden, weil das System „bisher immer funktioniert hat”.
Die 67.000 offenen Stellen, die keiner erklären kann
Hier kommt die ironische Pointe: Während alle über die Dark Factory diskutieren, boomen die Entwickler-Jobs. Über 67.000 offene Software-Engineering-Stellen bei Tech-Firmen in 2026 — ein Plus von 30 Prozent seit Jahresbeginn und doppelt so viele wie Mitte 2023.
Wie passt das zusammen? Meine Theorie: KI macht Entwicklung nicht billiger — sie macht mehr Entwicklung möglich. Projekte, die vorher zu teuer oder zu komplex waren, werden plötzlich machbar. Die Gesamtnachfrage nach Software steigt schneller als die Produktivitätsgewinne durch KI.
Das ist der gleiche Effekt, den wir bei der Einführung von Cloud Computing, Containerisierung und CI/CD gesehen haben: Jede Produktivitätssteigerung wurde durch explodierende Nachfrage überkompensiert.
Meine Prognose: Dark Factory ja, aber nicht so wie gedacht
Ich glaube, die Dark Factory kommt. Aber nicht als Ersatz für Entwickler, sondern als neue Schicht im Tech-Stack:
Kurzfristig (2026)
- Dark-Factory-Muster für Boilerplate, Tests und standardisierte Komponenten
- Menschliches Review für Architektur, Business-Logik und Security
- Observability-Tools als Pflicht für jeden KI-generierten Code-Pfad
Mittelfristig (2027-2028)
- Spezialisierte Dark-Factory-Pipelines für definierte Domänen (E-Commerce, CRUD, Landing Pages)
- Menschen als „Architekten” und „Evaluatoren”, nicht als „Codierer”
- Die Unterscheidung „KI-Code vs. Mensch-Code” wird irrelevant — alles wird hybrid
Langfristig
- Softwareentwicklung wird zu einer Design-Disziplin: Du beschreibst Was und Warum, die Maschine liefert das Wie
- Der „10x Engineer” wird zum „100x Architect”
- Die Dark Factory ist der Normalfall für Implementation, menschliche Kreativität ist der Engpass
Was du jetzt tun solltest
Willison hat eine Prognose, die ich für realistisch halte: Bis Ende 2026 werden 50 Prozent der Ingenieure 95 Prozent ihres Codes via KI generieren. Wenn du nicht dazugehören willst, wirst du abgehängt. Wenn du nur dazugehören willst, bist du ersetzbar.
Der Sweet Spot liegt dazwischen:
- Lerne, Agenten zu steuern — Prompt Engineering ist kein Nice-to-have mehr, sondern Kernkompetenz
- Verstehe die Risiken — OWASP Top 10 für Agentic Applications sollte Pflichtlektüre sein
- Investiere in Architektur — Die Fähigkeit, Systeme zu designen, die KI-Agenten effektiv nutzen können, wird zum Karriere-Differentiator
- Behalte den Überblick — Dark Factory bedeutet nicht „kein Mensch involviert”. Es bedeutet „kein Mensch im Loop für die Ausführung”. Der Mensch bleibt für Strategie, Architektur und Urteilsvermögen
Die Dark Factory kommt nicht über Nacht. Sie kommt schleichend, Aufgabe für Aufgabe, Feature für Feature. Die Frage ist nicht ob, sondern wie schnell — und ob du auf der steuerenden oder der gesteuerten Seite stehst.
Ich schreibe hier regelmäßig über KI-Agenten, Automatisierung und Webentwicklung aus der Praxis. Wenn du keinen Post verpassen willst, schau öfter vorbei — oder folge mir auf den üblichen Kanälen.
Kann dein Unternehmen von KI-Automation profitieren?
Die meisten Teams verschenken Stunden pro Woche an Aufgaben, die KI längst übernehmen könnte. Lass uns gemeinsam herausfinden, wo bei dir das größte Potenzial liegt.
Kostenlos beraten lassen