Ich habe einmal versucht, drei KI-Agenten gleichzeitig arbeiten zu lassen. Der Recherche-Agent fand Informationen. Der Schreib-Agent verfasste Inhalte basierend auf diesen Informationen. Der Prüf-Agent überprüfte den Entwurf, um die Genauigkeit sicherzustellen. In der Theorie: eine schöne Pipeline. In der Praxis: der Recherche-Agent fand irrelevante Informationen, der Schreib-Agent machte daraus einen selbstbewussten, aber falschen Artikel, und der Prüf-Agent genehmigte ihn, weil die Aussagen intern konsistent waren — einfach von der Realität getrennt.
Das war vor sechs Monaten. Seitdem habe ich Multi-Agenten-Workflows aufgebaut, die tatsächlich funktionieren. Der Unterschied ist nicht die Technologie — es ist das Verständnis, wann mehrere Agenten nützlich sind und wann sie die Dinge komplizierter machen.
Wann Mehrere Agenten Sinn machen
Multi-Agenten-Workflows funktionieren, wenn Sie wirklich unterschiedliche Aufgaben haben, die von Spezialisierung profitieren und klar getrennt werden können.
Gutes Beispiel: Eine Pipeline zur Code-Überprüfung. Der Agent 1 analysiert den Code auf Sicherheitsanfälligkeiten (spezialisiertes, sicherheitsfokussiertes Prompt). Der Agent 2 überprüft den Stil des Codes und die besten Praktiken (ein weiteres spezialisiertes Prompt). Der Agent 3 fasst die beiden Überprüfungen in einem für den Menschen verständlichen Format zusammen. Jeder Agent hat eine klare und präzise Aufgabe. Die Ergebnisse widersprechen sich nicht, da sie unterschiedliche Aspekte betrachten.
Schlechtes Beispiel: Drei Agenten, die an der Erstellung einer E-Mail arbeiten. Der Agent 1 schreibt. Der Agent 2 bearbeitet. Der Agent 3 überarbeitet. In der Praxis hebt der Agent 2 die Tonwahl des Agenten 1 auf, und der Agent 3 widerspricht oft den Änderungen des Agenten 2. Am Ende erhält man ein durchschnittliches Ergebnis aus drei unterschiedlichen Schreibstilen. Ein einzelner Agent mit einem guten Prompt verfasst bessere E-Mails.
Die Regel, die ich befolge: Verwenden Sie mehrere Agenten, wenn die Aufgaben parallel sind (verschiedene Perspektiven auf denselben Input) oder klar sequenziell mit gut definierten Übergabepunkten (die Ausgabe von Agent 1 ist ein vollständiges Artefakt, das Agent 2 unabhängig bewerten kann). Verwenden Sie keine mehreren Agenten, wenn die Aufgaben sich überschneiden oder wenn “Zusammenarbeit” bedeutet, “über den Stil zu diskutieren”.
Meine Multi-Agenten-Konfigurationen
Recherche → Zusammenfassen → Verteilen. Der Agent 1 sucht Informationen zu einem Thema im Web und compiled Rohdaten. Der Agent 2 nimmt diese Ergebnisse und erstellt eine strukturierte Zusammenfassung. Der Agent 3 formatiert die Zusammenfassung für verschiedene Plattformen (Slack-Post, E-Mail-Newsletter, interne Wiki-Seite). Jeder Agent hat klar definierte Eingaben und Ausgaben, und sie müssen nicht miteinander interagieren — sie sind eine Pipeline, kein Komitee.
Überwachen → Analysieren → Alarmieren. Der Agent 1 überwacht die Systeme und sammelt alle 5 Minuten Metriken. Der Agent 2 erhält die Metriken und analysiert sie auf Anomalien (indem er sie mit historischen Referenzen vergleicht). Der Agent 3 nimmt jede Anomalie und erstellt Alarmmeldungen mit Kontext und empfohlenen Maßnahmen. Das funktioniert, weil jeder Schritt eine klar definierte Ausgabe produziert, die der nächste Schritt eindeutig konsumieren kann.
Code → Testen → Überarbeiten. Wenn ich einen Unter-Agenten zum Coden einer Funktion erstelle, überprüft ein zweiter Agent die Ausgabe — prüft auf Bugs, Stilfragen und Genauigkeit. Wichtig: Der Prüf-Agent sieht nur den finalen Code, nicht die Überlegungen des Codier-Agenten. Das verhindert, dass der Prüf-Agent von den Erklärungen des ersten Agenten beeinflusst wird und zwingt ihn, den Code nach seinen eigenen Verdiensten zu bewerten.
Die Orchestrierungsmodelle
Sequentielle Pipeline. Agent A → Agent B → Agent C. Jeder Agent übernimmt die Ausgabe des vorhergehenden Agenten als Eingabe. Am einfachsten zu bauen, am leichtesten zu debuggen, am vorhersehbarsten. Hier sollten Sie anfangen.
Fan-out / fan-in. Eine Aufgabe wird gleichzeitig an mehrere Agenten gesendet (fan-out), dann werden ihre Ausgaben kombiniert (fan-in). Gut, um mehrere Perspektiven zu erhalten: Senden Sie denselben Code an einen Sicherheits-Agenten, einen Performance-Agenten und einen Stil-Agenten, und kombinieren Sie dann deren Überprüfungen.
Router-Modell. Ein orchestrierender Agent prüft die eingehende Anfrage, entscheidet, welcher spezialisierte Agent sie bearbeiten soll und leitet entsprechend weiter. “Handelt es sich um eine technische Frage? Leiten Sie an den technischen Agenten weiter. Handelt es sich um eine Abrechnungsfrage? Leiten Sie an den Abrechnungs-Agenten weiter.” Gut geeignet für kundenorientierte Systeme mit unterschiedlichen Anfragen.
Mensch im Loop. Der Agent erledigt eine Aufgabe → ein Mensch überarbeitet → der Agent fährt fort oder überarbeitet. Das ist nicht “multi-agent” im traditionellen Sinne, aber es ist das zuverlässigste Modell. Der Mensch liefert das Urteil und die Aufsicht, die den Agenten fehlen.
Die Fehlermuster
Kumulative Fehler. Agent A macht einen kleinen Fehler. Agent B verlässt sich auf die Ausgabe von Agent A, ohne sie zu hinterfragen. Agent C verstärkt den Fehler weiter. Am Ende der Pipeline ist die Ausgabe fälschlicherweise gesichert. Lösung: Fügen Sie Validierungsschritte zwischen den Agenten hinzu oder haben Sie einen abschließenden Prüf-Agenten, der die Ausgabe mit dem ursprünglichen Input überprüft.
Verlorener Kontext. Wenn Agent A eine Zusammenfassung an Agent B übermittelt, gehen Informationen verloren. Agent B arbeitet mit einem unvollständigen Bild und trifft Entscheidungen, die der vollständige Kontext von Agent A vermieden hätte. Lösung: Übertragen Sie strukturierte Daten (Schlüsselfakten, keine Zusammenfassungen) zwischen den Agenten und schließen Sie den ursprünglichen Eingang mit der bearbeiteten Ausgabe ein.
Konflikte zwischen Agenten. Zwei Agenten, die dieselbe Ausgabe bearbeiten, können in Konflikt geraten — einer fügt einen Abschnitt hinzu, der andere entfernt ihn. Lösung: Definieren Sie deutlich, welcher Agent welche Aspekte der Ausgabe besitzt. Lassen Sie nicht mehrere Agenten dasselbe Artefakt bearbeiten.
Debugging-Schwierigkeiten. Wenn ein Multi-Agenten-Workflow eine falsche Ausgabe produziert, ist es schwierig zu verstehen, welcher Agent den Fehler gemacht hat. Die Ausgabe jedes Agenten erscheint isoliert betrachtet vernünftig. Lösung: Protokollieren Sie jede Kommunikation zwischen den Agenten mit Zeitstempeln und Inhalten. Wenn etwas schiefgeht, verfolgen Sie die Pipeline Schritt für Schritt nach.
Einfache Anfänge
Wenn Sie noch nie zuvor einen Multi-Agenten-Workflow erstellt haben, beginnen Sie mit einer sequentiellen Pipeline mit zwei Agenten. Agent 1 erledigt die Arbeit, Agent 2 überarbeitet sie. Das ist alles. Machen Sie sich mit der Orchestrierung, den Übergaben und dem Debugging vertraut, bevor Sie weitere Agenten hinzufügen.
Die besten Multi-Agenten-Workflows, die ich erstellt habe, hatten 2 bis 3 Agenten. Die schlechtesten hatten 5. Mehr Agenten bedeuten mehr Koordination, mehr Fehlerquellen und mehr Debugging-Komplexität. Das Ziel ist nicht, die meisten Agenten zu haben — sondern die richtige Anzahl von Agenten für die Aufgabe.
🕒 Published: