Ich habe einmal versucht, drei KI-Agenten gleichzeitig zu betreiben. Der Forschungsagent fand Informationen. Der Schreibagent erstellte Inhalte basierend auf diesen Informationen. Der Prüfagent überprüfte den Entwurf auf Genauigkeit. In der Theorie: eine schöne Pipeline. In der Praxis: der Forschungsagent fand irrelevante Informationen, der Schreibagent verwandelte sie in einen selbstbewussten, aber falschen Artikel, und der Prüfagent genehmigte ihn, weil die Aussagen intern konsistent waren — nur von der Realität disconnected.
Das war vor sechs Monaten. Seitdem habe ich Multi-Agenten-Workflows entwickelt, die tatsächlich funktionieren. Der Unterschied liegt nicht in der Technologie — es ist das Verständnis, wann mehrere Agenten helfen und wann sie die Situation verschlechtern.
Wann mehrere Agenten sinnvoll sind
Multi-Agenten-Workflows funktionieren, wenn Sie wirklich unterschiedliche Aufgaben haben, die von Spezialisierung profitieren und klar voneinander getrennt werden können.
Gutes Beispiel: Eine Code-Überprüfungspipeline. Agent 1 analysiert den Code auf Sicherheitsanfälligkeiten (spezialisiertes Prompt, sicherheitsfokussiert). Agent 2 überprüft den Code-Stil und die besten Praktiken (anderes spezialisiertes Prompt). Agent 3 fasst beide Überprüfungen in ein menschenlesbares Format zusammen. Jeder Agent hat eine klar definierte, enge Aufgabe. Die Ausgaben stehen nicht im Konflikt, weil sie unterschiedliche Aspekte betrachten.
Schlechtes Beispiel: Drei Agenten, die gemeinsam eine E-Mail schreiben. Agent 1 entwirft. Agent 2 bearbeitet. Agent 3 prüft. In der Praxis macht Agent 2 die Tonwahl von Agent 1 rückgängig, und Agent 3 widerspricht oft den Änderungen von Agent 2. Am Ende hat man einen mittelmäßigen Durchschnitt aus drei verschiedenen Schreibstilen. Ein einzelner Agent mit einem guten Prompt schreibt bessere E-Mails.
Die Regel, die ich befolge: Verwenden Sie mehrere Agenten, wenn die Aufgaben parallel sind (verschiedene Perspektiven auf die gleiche Eingabe) oder klar sequenziell mit gut definierten Übergabepunkten (Die Ausgabe von Agent 1 ist ein vollständiges Artefakt, das Agent 2 unabhängig bewerten kann). Verwenden Sie keine mehreren Agenten, wenn sich die Aufgaben überschneiden oder wenn „Zusammenarbeit“ bedeutet, „über den Stil zu streiten.“
Meine funktionierenden Multi-Agenten-Setups
Forschung → Zusammenfassen → Verteilen. Agent 1 sucht im Internet nach Informationen zu einem Thema und fasst die Rohbefunde zusammen. Agent 2 nimmt diese Befunde und erstellt eine strukturierte Zusammenfassung. Agent 3 formatiert die Zusammenfassung für verschiedene Plattformen (Slack-Beitrag, E-Mail-Newsletter, interne Wiki-Seite). Jeder Agent hat eine klar definierte Eingabe und Ausgabe, und sie müssen nicht miteinander interagieren — sie sind eine Pipeline, kein Komitee.
Überwachen → Analysieren → Alarmieren. Agent 1 überwacht Systeme und sammelt alle 5 Minuten Kennzahlen. Agent 2 erhält die Kennzahlen und analysiert sie auf Anomalien (im Vergleich zu historischen Baselines). Agent 3 nimmt alle Anomalien und entwirft Alarmnachrichten mit Kontext und empfohlenen Maßnahmen. Das funktioniert, weil jeder Schritt eine klar definierte Ausgabe produziert, die der nächste Schritt ohne Mehrdeutigkeit konsumieren kann.
Code → Testen → Überprüfen. Wenn ich einen Coding-Sub-Agenten starte, um ein Feature umzusetzen, überprüft ein zweiter Agent die Ausgabe — überprüft auf Fehler, Stilprobleme und Richtigkeit. Der Schlüssel: Der Prüfagent sieht nur den finalen Code, nicht die Überlegungen des Coding-Agenten. Das verhindert, dass der Prüfagent von den Erklärungen des ersten Agenten beeinflusst wird, und zwingt ihn, den Code nach seinen eigenen Verdiensten zu bewerten.
Die Orchestrierungsmuster
Sequentielle Pipeline. Agent A → Agent B → Agent C. Jeder Agent nimmt die Ausgabe des vorherigen Agenten als Eingabe. Am einfachsten zu erstellen, am leichtesten zu debuggen, am vorhersagbarsten. Hier sollten Sie anfangen.
Fan-out / Fan-in. Eine Aufgabe wird gleichzeitig an mehrere Agenten gesendet (Fan-out), dann werden ihre Ausgaben kombiniert (Fan-in). Gut, um mehrere Perspektiven zu bekommen: senden Sie den gleichen Code an einen Sicherheitsagenten, einen Performance-Agenten und einen Stilagenten und kombinieren Sie dann ihre Bewertungen.
Router-Muster. Ein Orchestrierungsagent schaut sich die eingehende Anfrage an, entscheidet, welcher spezialisierte Agent sie bearbeiten sollte, und leitet entsprechend weiter. „Ist das eine technische Frage? An den technischen Agenten weiterleiten. Ist es eine Rechnungsfrage? An den Rechnungsagenten weiterleiten.“ Gut für kundenorientierte Systeme mit verschiedenen Anfragearten.
Human-in-the-loop. Agent erledigt Arbeit → Mensch überprüft → Agent fährt fort oder überarbeitet. Dies ist kein „Multi-Agent“-Ansatz im herkömmlichen Sinne, aber es ist das zuverlässigste Muster. Der Mensch liefert das Urteil und die Aufsicht, die den Agenten fehlen.
Die Fehlermuster
Fehlerakkumulation. Agent A macht einen kleinen Fehler. Agent B baut auf der Ausgabe von Agent A auf, ohne sie zu hinterfragen. Agent C verstärkt den Fehler weiter. Am Ende der Pipeline ist die Ausgabe selbstbewusst falsch. Lösung: Validierungsschritte zwischen den Agenten hinzufügen oder einen abschließenden Prüfagenten haben, der die Ausgabe mit der ursprünglichen Eingabe vergleicht.
Verlorener Kontext. Wenn Agent A eine Zusammenfassung an Agent B übergibt, gehen Informationen verloren. Agent B arbeitet mit einem unvollständigen Bild und trifft Entscheidungen, die der volle Kontext von Agent A verhindert hätte. Lösung: Strukturierte Daten (Schlüsselinformationen, keine Zusammenfassungen) zwischen den Agenten übergeben und die ursprüngliche Eingabe neben der verarbeiteten Ausgabe einfügen.
Agentenkonflikte. Zwei Agenten, die beide die gleiche Ausgabe ändern, können in Konflikt geraten — einer fügt einen Abschnitt hinzu, der andere entfernt ihn. Lösung: Klar definieren, welcher Agent welche Aspekte der Ausgabe besitzt. Lassen Sie nicht mehrere Agenten dasselbe Artefakt bearbeiten.
Debugging-Schwierigkeiten. Wenn ein Multi-Agenten-Workflow falsche Ausgaben produziert, ist es schwer herauszufinden, welcher Agent den Fehler gemacht hat. Die Ausgabe jedes Agenten sieht isoliert nachvollziehbar aus. Lösung: Protokollieren Sie jede Kommunikation zwischen den Agenten mit Zeitstempeln und Inhalten. Wenn etwas schiefgeht, verfolgen Sie die Pipeline Schritt für Schritt.
Einfach anfangen
Wenn Sie noch keinen Multi-Agenten-Workflow erstellt haben, beginnen Sie mit einer zweiphasigen sequentiellen Pipeline. Agent 1 erledigt die Arbeit, Agent 2 überprüft sie. Das ist alles. Gewöhnen Sie sich an die Orchestrierung, die Übergaben und das Debugging, bevor Sie weitere Agenten hinzufügen.
Die besten Multi-Agenten-Workflows, die ich erstellt habe, haben 2-3 Agenten. Die schlechtesten hatten 5. Mehr Agenten bedeuten mehr Koordinationsaufwand, mehr Fehlermöglichkeiten und mehr Debugging-Komplexität. Das Ziel ist nicht, die meisten Agenten zu haben — es geht darum, die richtige Anzahl von Agenten für die Aufgabe zu haben.
🕒 Published: