Agentische KI: Die nächste Generation intelligenter Software

Blogheader Agentische KI
25.02.2026
Von Dr. Arman Nassirtoussi

Der Begriff agentische KI bezeichnet Systeme, die über das bloße Generieren von Antworten hinausgehen. KI-Agenten planen, nutzen Werkzeuge, behalten Informationen im Gedächtnis und führen mehrstufige Aufgaben aus, um klar definierte Ziele zu erreichen. Erfahrt, was den neuen Ansatz so besonders macht!

 

Wenn ihr bereits mit Large Language Models (LLMs) gearbeitet habt, habt ihr vermutlich sowohl Faszination als auch Frustration erlebt. LLMs können mit erstaunlicher Sprachgewandtheit schreiben, zusammenfassen, schlussfolgern und erklären. Doch manchmal liegen sie selbstbewusst falsch, vergessen nach zwei Dialogschritten den Kontext oder scheitern, wenn eine Aufgabe konkrete Handlungen erfordert: ein System durchsuchen, eine Datei aktualisieren, eine Nachricht versenden, Berechnungen durchführen oder mehrere Schritte koordinieren.

Genau an dieser Stelle setzen KI-Agenten an. Agentische KI ist kein „größerer Chatbot“ – es handelt sich um ein neues Systemparadigma: Das Modell wird nicht mehr als abgeschlossenes Produkt, sondern als intelligenter Kern innerhalb eines umfassenderen Systems verstanden, das planen, handeln, beobachten, reflektieren, Werkzeuge einsetzen, sich erinnern und so lange Iterationen durchführen kann, bis ein Ziel erreicht ist.

In diesem Beitrag erfahrt ihr, was agentische KI ist (und was nicht), warum sie relevant ist, wie ihre Kernarchitektur und ihre Bausteine aussehen, welche Designmuster sich bewährt haben und wie agentische Systeme implementiert, evaluiert und weiterentwickelt werden können. Im neuen Onlinekurs Agentic AI: The New Software Paradigm auf dem KI-Campus könnt ihr noch tiefer in das Thema eintauchen.
 

1) Was „agentische KI“ wirklich bedeutet

Eine einfache LLM-Anwendung folgt typischerweise dem Muster: Nutzereingabe → LLM-Antwort. Agentische KI hingegen transformiert diese Interaktion in eine Schleife: Ziel → Plan → Handeln → Beobachten → Reflektieren → Iterieren → Fertig.

Traditionelle Automatisierung ist statisch („Wenn A, dann B“). Agentische Systeme sind dynamisch: Sie entscheiden, welche Werkzeuge aufgerufen werden, wann eine Schleife fortgesetzt oder beendet wird, wann Rückfragen nötig sind und wann an einen Menschen eskaliert werden sollte. Eine hilfreiche Kurzformel lautet: LLMs liefern Denkfähigkeit; Agenten liefern Handlungsfähigkeit.

Definition: Agentische KI ist ein KI-System, das ein LLM (oder mehrere Modelle) als Schlussfolgerungs- und Entscheidungsinstanz innerhalb einer Steuerungsebene nutzt, um mehrstufige Aktionen zu planen und auszuführen. Dabei nutzt das System verschiedene Tools, ein Gedächtnis und Feedbackschleifen, mit dem Ziel, definierte Vorgaben unter bestimmten Rahmenbedingungen zu erfüllen.
 

2) Warum agentische KI relevant ist

Agentische KI verschiebt den Fokus von „Antworten“ hin zu „Ergebnissen“ und ermöglicht fortgeschrittene Formen der Workflow-Automatisierung. Ein Chatbot kann Handlungsschritte vorschlagen; ein agentisches System versucht, die Arbeit tatsächlich zu erledigen: einen Bericht erstellen, eine Analyse durchführen, ein Ticket anlegen, Code überarbeiten, Tests ausführen und das Ergebnis iterativ verbessern.

Diese Entwicklung ist aktuell möglich, weil

  1. LLMs ein praktikables Abstraktionsniveau erreicht haben,
  2. KI-Modelle ihre Ergebnisse inzwischen so strukturiert ausgeben können, dass andere Programme zuverlässig damit weiterarbeiten können,
  3. sich Ökosysteme zur Standardisierung von Mustern herausgebildet haben und
  4. der Markt sich vom „Wow-Effekt“ hin zu messbarem Return on Investment (ROI) bewegt hat.
     

3) Agentische KI als System: Die Architektur

Ein robustes agentisches System ist nahezu nie „nur ein Modell“. Es besteht aus mehreren aufeinander abgestimmten Komponenten:

  • einer Benutzerschnittstelle,
  • einer Steuerungsebene,
  • einem Entscheidungskern  (LLMs plus Prompts und Richtlinien),
  • Werkzeugen und Integrationen,
  • Speicherkomponenten,
  • Mechanismen zur Bewertung und Überwachung.

Eine hilfreiche Analogie stammt aus der Kognitionspsychologie: LLMs verhalten sich häufig wie das schnelle, intuitive „System 1“ – schnell und automatisch. Die Orchestrierung übernimmt die Rolle von „System 2“ – langsam, kontrolliert, planend, prüfend und regelbasiert. Erfolgreiche agentische Systeme trennen klar zwischen Intelligenz (Modell) und Kontrolle (Systemlogik).
 

4) Zentrale Bausteine

4.1 Kontext-Engineering (Kurzzeitgedächtnis)
Bei der Generierung einer Antwort zur Laufzeit „weiß“ ein LLM nur das, was sich im aktuellen Kontextfenster befindet – also Systemanweisungen, Nutzernachrichten, abgerufene Dokumente, Tool-Ergebnisse und Zustandszusammenfassungen. Die Leistung hängt daher stark davon ab, was aufgenommen wird, wie es strukturiert ist und was bewusst weggelassen wird.
Gutes Kontext-Engineering bedeutet: klare Anweisungen, konsistente Formatierung, prägnante Zustandszusammenfassungen und selektive Informationsabfrage. Ganze Gesprächsverläufe oder Dokumente ungefiltert einzuspeisen, führt häufig zu schlechteren Ergebnissen.

4.2 Langzeitgedächtnis (persistenter Zustand)
Das Kurzzeitgedächtnis umfasst den aktuellen Kontext; das Langzeitgedächtnis ist ein externer Speicher, der später wieder abgerufen und in den Kontext integriert werden kann (z. B. Präferenzen, Projektkontext, Entscheidungen, Aufgabenhistorie oder Artefakte).
Die Herausforderung liegt weniger in der Speicherung als in der Abrufstrategie : Eine ungeeignete Informationsabfrage verschlechtert die Leistungsfähigkeit agentischer Systeme.

4.3 Werkzeuge und Aktionen
Werkzeuge ermöglichen es einem Agenten, mehr zu tun als nur zu kommunizieren. Das Modell schlägt einen strukturierten Tool-Aufruf vor; die Anwendung führt ihn aus; das Ergebnis wird an das Modell zurückgegeben; der Agent aktualisiert seinen Plan und fährt fort.

4.4 Code-Ausführung
Code-Ausführung bezeichnet die Fähigkeit, bei Bedarf Programmcode auszuführen – etwa für deterministische Aufgaben wie mathematische Berechnungen, Verarbeiten und Strukturieren von Daten (Parsing), Datentransformationen oder Validierungen. Dies sollte idealerweise in einer isolierten Sandbox mit Zeitlimits und eingeschränkten Zugriffsrechten erfolgen.

4.5 Orchestrierungslogik
Die Orchestrierung entscheidet, wann gedacht, ein Werkzeug aufgerufen, eine Schleife wiederholt, eine Rückfrage gestellt, gestoppt oder eskaliert wird. In klassischer Software sind Verzweigungen fest definiert; in agentischen Systemen können Bedingungen dynamisch anhand von Zwischenergebnissen und Nebenbedingungen entschieden werden.
 

5) Bewährte Designmuster

Plan → Ausführen → Verifizieren:
Ein strukturierter Plan wird erstellt, die Schritte werden umgesetzt, das Ergebnis wird überprüft – anschließend wird iteriert oder beendet. Die Verifikation kann durch einen zweiten Modelldurchlauf, ein Prüfmodul, deterministische Berechnungen, Tests oder eine menschliche Freigabe erfolgen.

Reflexion:
Ein Ergebnis wird zunächst erzeugt und anschließend kritisch geprüft und verbessert. So werden Inkonsistenzen oder Anforderungslücken häufig erkannt.

Multi-Agenten-Rollen:
Eine Spezialisierung von Agenten (z. B. Planer, Rechercheur, Ausführender, Reviewer) kann Ergebnisse verbessern. Entscheidend ist nicht die Anzahl der Agenten, sondern klar definierte Verantwortlichkeiten.

Human-in-the-Loop:
Bei wirkungsstarken Aktionen sollten Bestätigungs- oder Freigabeschritte integriert und unsichere Fälle eskaliert werden. Solche Kontrollpunkte können risikobasiert dynamisch ausgelöst werden.
 

6) Frameworks, Plattformen und Ökosystem

Die meisten Teams nutzen unterstützende Werkzeuge und Plattformen, um agentische KI-Systeme strukturiert umzusetzen. Dazu gehören Programmierschnittstellen (APIs) für strukturierte Ausgaben und Tool-Aufrufe, Frameworks zur Steuerung von Workflows und Speichermechanismen sowie graphbasierte Systeme zur Abbildung komplexer Abläufe. Ergänzend kommen Werkzeuge zur Bewertung und Überwachung zum Einsatz. Sie helfen dabei, Leistungsfähigkeit, Stabilität und Zuverlässigkeit systematisch messbar zu machen und kontinuierlich zu verbessern.
 

7) Deployment: Cloud-Modelle vs. lokale Modelle

Cloud-Modelle bieten hohe Leistungsfähigkeit und flexible Skalierung, bringen jedoch Abwägungen in Bezug auf Datenschutz, Kosten und Anbieterabhängigkeit mit sich. Lokale Modelle ermöglichen mehr Kontrolle über Daten und Infrastruktur, sind jedoch häufig durch verfügbare Hardware begrenzt und erfordern eigenständige Wartung sowie regelmäßige Updates. Viele produktive Systeme verfolgen daher einen hybriden Ansatz.
 

8) Bewertung und Überwachung

Agentische Systeme erzeugen mehrstufige Ausführungsspuren, treffen Entscheidungen und führen Aktionen aus. Fehler können nicht nur im Endergebnis, sondern auch während einzelner Zwischenschritte auftreten – deshalb ist eine systematische Bewertung erforderlich. Bewertungen erfassen unter anderem Erfolgsquote, Korrektheit von Tool-Aufrufen, Einhaltung von Richtlinien und Rahmenbedingungen, Antwortzeit und Kosten sowie Sicherheits- und Compliance-Aspekte. Die Überwachung dient sozusagen als „Flugschreiber“ des Systems: Protokolliert werden etwa Prompts, Tool-Aufrufe, abgerufene Dokumente, Zwischenentscheidungen, Ergebnisse, Wiederholungsversuche und Fehlermeldungen. Diese Transparenz ermöglicht es, Fehlerquellen gezielt zu identifizieren und Verbesserungen systematisch umzusetzen.
 

9) Kontinuierliche Weiterentwicklung agentischer Systeme

Die Verbesserung agentischer Systeme erfolgt iterativ: Fehler und Schwachstellen werden beobachtet, Prompts, Richtlinien und Orchestrierung angepasst, Informationsabruf und Einschränkungen optimiert und automatisierte Tests ergänzt, um Rückschritte zu vermeiden. Modelle werden nur dann angepasst, wenn strukturelle Maßnahmen nicht ausreichen. Gezieltes Weitertrainieren (Fine-Tuning) wird relevant, wenn Optimierungen auf Systemebene an ihre Grenzen stoßen. Dabei wird das Modell mit spezifischen Beispieldaten weitertrainiert, um gewünschtes Verhalten robuster zu machen. Sobald ein stabiles und verlässliches Verhalten etabliert ist, kann Distillation eingesetzt werden. Dabei werden die Fähigkeiten eines großen Modells auf ein kleineres übertragen, um Kosten zu senken und die Effizienz im produktiven Betrieb zu steigern.
 

Fazit

Agentische KI steht für einen grundlegenden Entwicklungsschritt in der Gestaltung intelligenter Softwaresysteme. Die Modelle bringen kognitive Fähigkeiten mit – doch erst das Zusammenspiel aus Planung, Gedächtnis, Werkzeugnutzung und klarer Steuerungslogik macht daraus verlässliche, zielgerichtete Systeme, die Aufgaben eigenständig bearbeiten können.

Wenn ihr mehr über agentische KI erfahren möchtet, schaut euch unseren neuen Onlinekurs Agentic AI: The New Software Paradigm an. Wir freuen uns über euer Feedback!

 

Hinweis: Dieser Blogbeitrag wurde ursprünglich in englischer Sprache verfasst und mit Unterstützung von ChatGPT ins Deutsche übersetzt sowie sprachlich angepasst.

Dr. Arman Nassirtoussi
ElevateSoul.ai

Dr. Arman Nassirtoussi ist KI-Praktiker und Gründer von ElevateSoul.ai, einer agentischen KI-Coaching- und Bildungsplattform für Karrieren und Start-ups im Bereich Daten und KI. Er promovierte im Bereich Künstliche Intelligenz mit dem Schwerpunkt auf prädiktivem Intraday-Trading unter Einsatz von Natural Language Processing (NLP), Sentimentanalyse und großskaligem Text Mining von Online-Nachrichten.

Tipp: Hast du bereits in unseren FAQ nach einer Antwort auf deine Frage gesucht?