Jedes RAG-System beginnt mit einem Dataset.
"Den Text aus dem PDF extrahieren"
Wo ist hier der relevante Kontext?
Welcher Text bezieht sich auf was?
BILLY BÜCHERREGAL
# TEILE ZUSAMMENFÜGEN
Verwende karamellisierten Zucker oder Glasur!
# 1 SCHNEIDE DIE SCHABLONEN AUS
# 2 SCHNEIDE DIE FORMEN MIT HILFE DER SCHABLONEN AUS
# TEILE ZUSAMMENFÜGEN
Verwende karamellisierten Zucker oder Glasur.
Bei Verwendung von Zucker: Etwas Kristallzucker in einer Pfanne schmelzen, um das Eintauchen der Kanten der großen Lebkuchenstücke zu erleichtern. Der Zucker wird schnell – in nur ein bis zwei Minuten – wieder fest.
Vorsicht beim Handhaben heißer Teile und Materialien!
Der Text ...
Die Funktion des Textes ...
Die Bilder...
Der Text in den Bildern/OCR
Die rekonstruierten Tabellen im Dokument
Die Daten der Diagramme im Dokument
Der Erklärungen in den Flussdiagrammen
Metadata Extraction (Titel, Autor, Referenzen)
Tonspur?
Transcription?
Der Kontext ergibt sich aus Video
und Bild, zeitlich integriert
Dagster-Pipeline mit
DistilWhisper &
ffmpeg Scene Detection &
OpenAi Bilderklärung
Versteckte Zusammenhänge finden, holistische Fragen beantworten, Multi-Rag per Recherche.
Tracing & Debugging
Live-Monitoring
Evaluation
Dataset & Testing
An LLM agent runs tools in a loop to achieve a goal.
"USB für KI"
"Hatten wir da nicht einen MCP-Server für?"
Aber es darf doch nicht jeder alle Daten sehen!
Authentifiziert gegen OAuth
Audit Logs
Freigabe von Tools
Verlässliches Arbeiten mit Daten
Komplexe Probleme lösen
Wie man Firmendaten trotz LLM absichert.
Wir haben authentifzierte Nutzer
Wir haben Audit-Logs
Wir haben Reflektion & Roll-Back
Warum lassen wir sie dann nicht für uns Webapps bedienen?
Eingabe & Streaming
Formatierung
Model, Thinking
Aktive Tools
Shared State
Voice-Frontend
Code, Markdown
Tool Results & Sources
Specialized GUI
Synchronisiert mit Chat
Synchronisiert mit Agent
"Was sieht der Nutzer gerade"
Tool Call Accuracy
Wurden die richtigen Tools mit korrekten Parametern aufgerufen?
Trajectory Evaluation
Bewertet die Sequenz der Aktionen - war der Lösungsweg logisch und effizient?
Topic Adherence
Bleibt der Agent innerhalb der vorgegebenen Domänen/Themen?
Tool Call F1-Score
Kombiniert Präzision und Recall der Werkzeugaufrufe - wie nah kam der Agent am erwarteten Verhalten?
An LLM agent runs tools in a loop to achieve a goal.
Workflows
Follow fixed, structured paths for predictable results, but offer less flexibility.
Agents:
Use an LLM to choose tools and achieve goals, providing autonomy but with varying predictability.
Agentic Systems:
Consisting of workflows and agents.
Aber:
Mehr Schleifen =
Mehr Context =
Mehr Chaos
Workflows _und_ Agenten
Pregel-Ansatz (aus Pagerank)
Verteilbarer State
Schleifen
Checkpointing
Rollbacks
Memory
Multiagenten-Support
Supervisor
Swarm
Deep Agents
Triggert Not-invented-Here-Syndrome
Jede hinreichend komplexe eigene Lösung sieht ähnlich aus.
https://github.com/johannhartmann/learning-agent