Ich habe meinen ersten IA-Agenten gestartet: das habe ich gelernt

📖 12 min read•2,249 words•Updated Mar 30, 2026

Okay, Freunde, Jake Morrison hier, zurück auf clawgo.net. Heute werden wir uns mit etwas beschäftigen, was mir seit Wochen im Kopf herumgeht, etwas, mit dem ich aktiv in meinem eigenen Homeoffice beschäftigt war: die überraschend heiklen ersten Schritte mit einem KI-Agenten. Nicht irgendein Agent, sondern speziell, wie man einen aufgabenorientierten Agenten zum Laufen bringt, ohne in Konfigurationsdateien oder philosophische Debatten über AGI zu ertrinken. Wir sprechen über den ‘ersten Schritt’, aber mit einem Laserfokus auf die Erstkonfiguration und diese erste erfolgreiche unabhängige Aktion. Denn seien wir ehrlich, dort stoßen die meisten Leute, ich eingeschlossen für eine lange Zeit, auf eine Wand.

Mein Ansatz heute wird sich nicht mit den großen Visionen von KI-Agenten beschäftigen, die unser Leben steuern. Es geht um den Moment, in dem Sie von “das ist in der Theorie cool” zu “Oh mein Gott, er hat gerade etwas gemacht, was ich ihm nicht ausdrücklich gesagt habe, aber was ich wollte, dass er es tut.” übergehen. Es geht um den Übergang von einem Skript zu einem aufkeimenden Intellekt. Und ich möchte Ihnen zeigen, wie Sie dies mit minimalem Aufwand erreichen können, indem Sie eine aktuelle OpenClaw-Konfiguration verwenden, mit der ich gekämpft habe.

Mein Wochenende-Krieger-Projekt: Der Agent “Find My Charger”

Ich lebe in einem Haus mit zwei Teenagern und einem Partner, der ebenfalls von zu Hause aus arbeitet. Unser Haus ist ein schwarzes Loch für Ladekabel, besonders mein USB-C-Ladegerät fürs Laptop. Es ist immer ’ausgeliehen’ und landet an den unerklärlichsten Orten. Mein jüngster Frust überschritt am vergangenen Samstag einen Höhepunkt, als ich 20 Minuten damit verbrachte, das Wohnzimmer zu durchsuchen, um es schließlich unter einem Stapel Gesellschaftsspiele im Esszimmer wiederzufinden. In diesem Moment kam die Inspiration: ein KI-Agent, der mir hilft, meine Sachen wiederzufinden. Lächerlich? Vielleicht. Praktisch? Definitiv, wenn es mir 20 Minuten pro Woche spart.

Der erste Schritt, und ehrlich gesagt, das größte Hindernis, war nicht die KI selbst, sondern das Einrichten der Umgebung. Ich habe seit Jahren mit Python herumgespielt, aber das gesamte Ökosystem von Agenten scheint sich jede Woche zu ändern. Mein Ziel war einfach: ein Agent, der in der Lage ist, die Geräte im lokalen Netzwerk abzufragen, nach spezifischen Dateien zu suchen und möglicherweise sogar mit intelligenten Haushaltsgeräten zu interagieren, um zu fragen: “Hey Google, wo ist Jakes Ladegerät?”

Die ersten Kopfschmerzen: Einrichtung der Umgebung und Abhängigkeiten

Ich entschied mich, OpenClaw als Framework für meinen Agenten zu verwenden. Warum OpenClaw? Weil es ein gutes Gleichgewicht zwischen der Möglichkeit bietet, komplexe Aufgaben zu erledigen, und einer Community hat, die nicht ausschließlich aus Doktoranden besteht. Außerdem hat ihre Dokumentation, obwohl sie gelegentlich dicht ist, im Allgemeinen genug Beispiele, um Sie auf die Sprünge zu helfen.

Mein erster Versuch bestand darin, einfach `pip install openclaw` auszuprobieren. Großer Fehler. Ich hatte eine Reihe von Abhängigkeitskonflikten. Es stellte sich heraus, dass meine lokale Python-Umgebung aufgrund verschiedener anderer Projekte durcheinander war. Hier möchte ich Ihnen einen guten Ratschlag geben:

Verwenden Sie eine virtuelle Umgebung. Immer. Keine Ausnahmen. Ich weiß, ich weiß, das klingt grundlegend, aber ernsthaft, das wird Ihnen Stunden beim Debuggen sparen.

Hier ist, was ich gemacht habe:


python3 -m venv openclaw_env
source openclaw_env/bin/activate
pip install openclaw

Es fühlte sich an wie ein kleiner Sieg für sich. Die Erstkonfiguration ohne mir die Haare auszureißen zu bewältigen, war großartig. Der nächste Schritt bestand darin, klarzustellen, was mein Agent tatsächlich TUN sollte.

Die erste Aufgabe definieren: Der Agent “Network Pinger”

Bevor ich mich daran machte, nach dem Ladegerät zu suchen, benötigte ich einen Proof of Concept. Ich wollte, dass mein Agent einfach mein lokales Netzwerk scannt und mir sagt, welche Geräte online sind. Das ist ein häufiger erster Schritt für viele Agentenprojekte – dafür zu sorgen, dass er mit seiner unmittelbaren Umgebung interagiert. Ich dachte mir, wenn er Geräte erfolgreich pingen kann, dann wäre die Abfrage von Smart-Home-Hubs oder sogar spezifischen IP-Adressen von Geräten der nächste logische Schritt.

Die OpenClaw-Agenten arbeiten nach einem Modell von ‘Zielen’ und ‘Werkzeugen.’ Der Agent versucht, sein Ziel zu erreichen, indem er die entsprechenden Werkzeuge auswählt und einsetzt. Für meinen Netzwerk-Pinger war das Ziel klar: “Aktive Geräte im lokalen Subnetz identifizieren.”

Das benötigte Werkzeug war ein Netzwerkscanner. Python hat einige Bibliotheken dafür, und ich entschied mich für `scapy` wegen seiner Flexibilität, obwohl es etwas leistungsstärker ist, als ich es strikter für das Pingen benötigte. Ich schrieb eine einfache Python-Funktion, die einen ARP-Scan in meinem lokalen Subnetz durchführen würde.

Das erste Werkzeug bauen: `network_scanner.py`


# network_scanner.py
from scapy.all import ARP, Ether, srp
import sys

def perform_arp_scan(subnet="192.168.1.0/24"):
 """
 Führt einen ARP-Scan im angegebenen Subnetz durch und gibt eine Liste aktiver IPs zurück.
 """
 print(f"Scanne Subnetz: {subnet}...")
 try:
 ans, unans = srp(Ether(dst="ff:ff:ff:ff:ff:ff")/ARP(pdst=subnet), timeout=2, verbose=0)
 active_ips = [res.psrc for res in ans.res]
 print(f"Gefundene {len(active_ips)} aktive Geräte.")
 return active_ips
 except Exception as e:
 print(f"Fehler während des ARP-Scans: {e}")
 # Das ist ein häufiges Problem unter Linux, wenn es nicht mit ausreichenden Berechtigungen ausgeführt wird
 if "Permission denied" in str(e) and sys.platform.startswith("linux"):
 print("Unter Linux müssen Sie es möglicherweise mit sudo ausführen oder Berechtigungen setzen.")
 print("Versuchen Sie: sudo python your_script.py oder sudo setcap cap_net_raw+ep /usr/bin/python3.x")
 return []

if __name__ == "__main__":
 # Beispielnutzung:
 # Stellen Sie sicher, dass Sie Ihr tatsächliches Subnetz einsetzen
 active_devices = perform_arp_scan("192.168.1.0/24")
 print("Gefundene aktive Geräte:")
 for ip in active_devices:
 print(f"- {ip}")

Eine kleine Anmerkung zu `scapy`: Unter Linux benötigen Sie oft Root-Rechte oder spezifische Berechtigungen (`setcap cap_net_raw+ep /usr/bin/python3.x`) für grundlegende Socket-Operationen wie ARP-Scans. Das ist etwas, was ich immer vergesse und dann 15 Minuten damit verbringe, Berechtigungsfehler zu debuggen. Nur ein kleiner Hinweis.

Das Werkzeug in OpenClaw integrieren

Nun, wie bekomme ich OpenClaw dazu, tatsächlich diese Funktion `perform_arp_scan` zu nutzen? OpenClaw hat eine Möglichkeit, Funktionen als ‘Werkzeuge’ zu registrieren, die der Agent dann aufrufen kann. Hier beginnt die Magie zu wirken. Sie definieren ein Werkzeug mit einer Beschreibung, und der Agent verwendet sein internes Denken, um zu entscheiden, wann dieses Werkzeug angebracht ist.

Hier ist ein vereinfachtes `agent_main.py` für unseren ersten Agenten:


# agent_main.py
from openclaw import Agent
from openclaw.tools import Tool
from network_scanner import perform_arp_scan # Importieren Sie unsere Werkzeugfunktion

# Definieren Sie das Werkzeug für OpenClaw
# Die Beschreibung ist entscheidend, damit der Agent versteht, wann er es verwenden kann
network_scan_tool = Tool(
 name="network_scanner",
 description="Scannt das lokale Subnetz nach aktiven IP-Adressen mit ARP. "
 "Nimmt ein optionales Argument: 'subnet' (z. B. '192.168.1.0/24'). "
 "Gibt eine Liste aktiver IPs zurück.",
 func=perform_arp_scan # Binden an unsere Python-Funktion
)

# Initialisieren Sie den Agenten
# Um es einfach zu halten, verwenden wir einen Basisspeicher und ein LLM (z. B. lokal Ollama oder OpenAI)
# Ersetzen Sie 'your_llm_model_name' durch Ihre eigene LLM-Konfiguration
# Für lokale LLMs benötigen Sie möglicherweise etwas wie:
# llm = LocalLLM(model_path="/path/to/your/model.gguf", api_base="http://localhost:11434/v1")
# Oder für OpenAI:
# llm = OpenAI(api_key="your_openai_api_key", model="gpt-4-turbo")
# Für dieses Beispiel nehmen wir ein fiktives LLM zur Veranschaulichung oder ein lokal konfiguriertes.
# Ich habe normalerweise Ollama lokal für die Entwicklung.

# --- WICHTIG: Ersetzen Sie durch Ihre tatsächliche LLM-Konfiguration ---
# Beispiel einer lokalen Ollama-Konfiguration (vorausgesetzt, sie funktioniert am Standardport)
from openclaw.llms import Ollama # Wenn Sie Ollama verwenden
llm = Ollama(model="llama3") # Oder welches Modell auch immer Sie bei Ollama ausführen

# Wenn Sie OpenAI bevorzugen (auskommentieren und durch Ihren Schlüssel/Modell ersetzen)
# from openclaw.llms import OpenAI
# llm = OpenAI(api_key="sk-...", model="gpt-3.5-turbo")
# --- ENDE WICHTIG ---

agent = Agent(
 llm=llm,
 tools=[network_scan_tool], # Unser Werkzeug registrieren
 memory=None # Einfach anfangen, bisher keine ausgeklügelte Erinnerung
)

# Definieren Sie das Ziel des Agenten
# Dies ist das Prompt, das den Agenten leitet
agent.set_goal("Finden Sie alle aktiven Geräte im Subnetz 192.168.1.0/24 und listen Sie deren IP-Adressen auf.")

print("Starte den Agenten...")
agent.run()
print("Agent beendet.")

# Sie können hier den Verlauf oder die Ergebnisse des Agenten überprüfen
print("\nLetzte Gedanken des Agenten (falls vorhanden):")
print(agent.memory.get_messages() if agent.memory else "Keine Erinnerung konfiguriert.")

Als ich das zum ersten Mal ausführte, war es wirklich aufregend. Der Agent hat nach der Analyse seines Ziels korrekt erkannt, dass `network_scanner` das richtige Werkzeug war. Er rief dann die Funktion `perform_arp_scan` mit dem angegebenen Subnetz auf. Mein Terminal begann, die IP-Adressen meines Routers, meiner verschiedenen Smart Plugs, der Handys meiner Kinder und ja, sogar meines Smart Speakers anzuzeigen. Es hat funktioniert!

Das mag trivial erscheinen, aber es ist der erste autonome Schritt. Der Agent hat nicht einfach ein Skript ausgeführt, das ich geschrieben habe; er hat das richtige Skript basierend auf seinem Ziel und den verfügbaren Werkzeugen ausgewählt. Das ist das Herzstück dessen, was diese Agenten so mächtig macht.

Was ich aus diesem ersten Versuch gelernt habe

Das Funktionieren dieses Basisagenten hat mir einige wichtige Lektionen über den Einstieg in KI-Agenten beigebracht:

Fangen Sie lächerlich klein an. Meine ursprüngliche Idee für den Ladeagenten war zu komplex. Das Aufteilen in „Netzwerkscan“, dann „intelligente Lautsprecher abfragen“, dann „lokale Dateien durchsuchen“ macht es überschaubarer.
Die Beschreibungen der Werkzeuge sind entscheidend. Der Agent verlässt sich stark auf die `description`, die Sie Ihren Werkzeugen geben, um zu entscheiden, welches er verwenden soll. Seien Sie klar, prägnant und fügen Sie die erwarteten Argumente hinzu.
Die Wahl des LLM ist wichtig, aber für die anfängliche Konfiguration nicht so entscheidend. Für ein einfaches Proof of Concept ist ein lokales LLM wie Llama 3 über Ollama völlig akzeptabel und spart API-Kosten. Sie können es später immer noch ersetzen.
Fehlerhandling in den Werkzeugen ist kritisch. Wenn Ihr Werkzeug eine nicht behandelte Ausnahme auslöst, kann der Agent abstürzen oder hängen bleiben. Denken Sie an Randfälle und Berechtigungen.
Der Moment „Aha!“ ist real. Wenn der Agent autonom Ihren benutzerdefinierten Code auswählt und ausführt, ist das beeindruckend. Es ist nicht nur eine hübsche Umhüllung um einen Funktionsaufruf; es ist ein Entscheidungsprozess.

Über den Pinger hinaus: Auf dem Weg zum Ladesucher

Mit dem funktionierenden Netzwerk-Pinger sind meine nächsten Schritte für den Ladesucher-Agenten klarer:

Werkzeug für die Interaktion mit dem Smart Speaker: Integrieren Sie eine Instanz von Home Assistant oder direkt über die APIs von Google/Alexa (wenn ich einen API-Zugang ohne zu viel Aufwand erhalten kann), um Informationen über die Standorte der Geräte anzufordern.
Werkzeug zur Dateisuche: Eine Funktion zum Durchsuchen bestimmter Verzeichnisse auf meinem lokalen NAS oder Computer nach Dateien, die anzeigen könnten, wo ein Ladegerät zuletzt verwendet wurde (z. B. spezifische Anwendungsprotokolldateien).
Verbesserte Zieldefinition: Geben Sie dem Agenten mehr Kontext, wie „Mein Laptop-Ladegerät ist ein schwarzes USB-C-Kabel. Es ist normalerweise in meinem Büro, könnte aber auch manchmal im Wohnzimmer oder Esszimmer sein. Finden Sie den wahrscheinlichsten Standort.“

Jedes dieser Elemente wird ein weiterer kleiner Schritt, ein neues Werkzeug, eine neue Iteration sein. Aber der schwierige Teil – die anfängliche Konfiguration der Umgebung und das Setzen der ersten autonomen Entscheidung des Agenten – ist abgeschlossen.

Lektionen für Ihren ersten Agenten

Wenn Sie daran interessiert sind, in die Welt der KI-Agenten einzutauchen, hier sind meine Ratschläge:

Wählen Sie eine einfache und konkrete Aufgabe. Nicht „meine Lebensführung managen“, sondern „schicken Sie mir eine tägliche Wetterzusammenfassung“ oder „finden Sie ungenutzte Dateien, die älter als 6 Monate sind“.
Richten Sie eine saubere Python-Umgebung ein. Vernachlässigen Sie das nicht.
Wählen Sie einen Rahmen. OpenClaw, Langchain, CrewAI – sie haben alle ihre Vor- und Nachteile. OpenClaw hat für mich gut funktioniert, da es ein gutes Gleichgewicht zwischen Funktionen und Zugänglichkeit bietet.
Schreiben Sie Ihr erstes Werkzeug. Machen Sie es zu einer grundlegenden Funktion, die etwas Greifbares erreicht (wie ein Netzwerk scannen, eine Datei lesen oder einen einfachen API-Aufruf durchführen).
Verfassen Sie eine klare Beschreibung des Werkzeugs. So versteht Ihr Agent Ihr Werkzeug.
Definieren Sie ein präzises Ziel für Ihren Agenten. Je spezifischer es ist, desto besser werden die anfänglichen Entscheidungen des Agenten.
Führen Sie es aus und debuggen Sie es. Erwarten Sie Fehler. Feiern Sie die kleinen Erfolge.

Die Welt der KI-Agenten entwickelt sich noch schnell weiter, aber dieses erste Hindernis zu überwinden, um *etwas* mit einem Agenten zu machen, ist unglaublich befähigend. Es zeigt Ihnen das Potenzial aus erster Hand. Also legen Sie los, wählen Sie ein kleines Problem aus und lassen Sie einen Agenten Ihnen helfen, es zu lösen. Sie könnten Ihr fehlendes Ladegerät finden – oder zumindest auf dem Weg dorthin viel lernen.

Jake Morrison, abgeschlossen. Und zurück auf die Suche nach meinem Ladegerät, wahrscheinlich beim nächsten Mal mit einem intelligenteren Assistenten.

Ich habe meinen ersten IA-Agenten gestartet: das habe ich gelernt

Mein Wochenende-Krieger-Projekt: Der Agent “Find My Charger”

Die ersten Kopfschmerzen: Einrichtung der Umgebung und Abhängigkeiten

Die erste Aufgabe definieren: Der Agent “Network Pinger”

Das erste Werkzeug bauen: `network_scanner.py`

Das Werkzeug in OpenClaw integrieren

Was ich aus diesem ersten Versuch gelernt habe

Über den Pinger hinaus: Auf dem Weg zum Ladesucher

Lektionen für Ihren ersten Agenten

Ähnliche Artikel

Related Articles

Mein Wochenende-Krieger-Projekt: Der Agent “Find My Charger”

Die ersten Kopfschmerzen: Einrichtung der Umgebung und Abhängigkeiten

Die erste Aufgabe definieren: Der Agent “Network Pinger”

Das erste Werkzeug bauen: `network_scanner.py`

Das Werkzeug in OpenClaw integrieren

Was ich aus diesem ersten Versuch gelernt habe

Über den Pinger hinaus: Auf dem Weg zum Ladesucher

Lektionen für Ihren ersten Agenten

Ähnliche Artikel

You May Also Like

📚 You Might Also Like

Related Articles