CEO-Worker-Pattern, wenn ein Agent nicht reicht
Warum professionelle AI-Systeme 2026 fast immer Multi-Agent sind. Und wie das konkret funktioniert.
Das Problem mit Single-Agents
Ein einzelner Agent wird schlechter je komplexer die Aufgabe wird. Das ist nicht Theorie, das ist Code-Realitaet.
Warum? Das Context-Fenster fuellt sich mit jedem Tool-Call. Nach 20 Tool-Calls hat der Agent 15.000 Tokens History gelesen und seine Entscheidungen werden schwammiger. Nach 50 Tool-Calls verliert er den Faden komplett.
Mit einem großen Kontextfenster (Claude Opus mit 1M Tokens, Gemini 2.5 Pro mit 2M) geht's länger, aber das Problem existiert weiterhin.
Die Lösung: Aufteilung in Spezialisten
Statt einen Agent alles machen zu lassen, baust Du einen Dirigenten der spezialisierte Arbeiter aufruft. Jeder Arbeiter hat einen kurzen, fokussierten Prompt und macht nur eine Sache.
Das ist das CEO-Worker-Pattern.
CEO (manchmal "Orchestrator" oder "Planner"):
- Bekommt das große Ziel.
- Entscheidet welche Arbeiter was machen.
- Sammelt Ergebnisse ein und liefert finales Ergebnis.
Worker:
- Bekommt eine konkrete Unteraufgabe.
- Hat eigene Tools, eigenen kleinen Kontext.
- Liefert ein klares Ergebnis zurück.
Der CEO sieht nie die Rohdaten, nur die Zusammenfassungen. Das hält sein Kontextfenster sauber.
Warum das funktioniert
Jeder Worker-Call ist ein Sub-Agent mit frischem Kontext. Die History lebt nur im CEO. Ein Worker weiss nichts vom großen Bild, er macht nur seinen Job.
Beispiel Blog-Post-Recherche-Task:
- CEO bekommt: "Schreib einen Blog-Post über MCP-Adoption 2026."
- CEO → Research-Worker 1: "Finde 10 aktuelle Artikel über MCP-Protokoll."
- CEO → Research-Worker 2: "Finde Zahlen zur Adoption bei Unternehmen."
- CEO → Critic-Worker: "Pruefe diese 3 Thesen auf Schwächen."
- CEO → Writer-Worker: "Schreib den Post basierend auf diesen Materialien."
Jeder Worker-Call ist isoliert, der CEO hat nur die Ergebnisse, keine Detail-History. Das System kann lange laufen ohne an sich selbst zu ersticken.
Tool-Support 2026
Claude Agent SDK hat Task-Tool: ein Sub-Agent wird mit einem eigenen Prompt aufgerufen, arbeitet, liefert Ergebnis zurück.
OpenAI Agents SDK hat handoffs: Agent A sagt "ich uebergebe an Agent B", der uebernimmt.
Claude Code hat das eingebaut: das Agent-Tool, mit spezialisierten Subagents für Code-Exploration, Code-Review, Research, General-Purpose.
Wie Du das baust (in der Praxis)
Das Minimum-Rezept:
- Definier die Worker-Rollen. Was sind die typischen Spezialisten die Du brauchst? Research, Critic, Analyst, Writer, Reviewer? Für Dein Projekt.
- Schreib pro Rolle einen System-Prompt. 5-10 Sätze: wer bist Du, was ist Dein Input, was soll Dein Output sein, was sind die Regeln.
- Bau den CEO-Prompt. Er kriegt das große Ziel + die Liste verfügbarer Worker + die Anleitung wie er sie aufruft.
- Test. Gib dem CEO einen echten Task. Schau in die Logs wer wann was aufgerufen hat. Iterieren bis die Aufteilung klar wird.
Nächste Lektion
Die drei klassischen Worker-Rollen die in jedem ernsthaften System vorkommen: Research, Critic, Analyst. Warum genau diese drei, und was sie voneinander unterscheidet.