Hitchhikers Guide to Corporate AI

Hi!

Dev-Level "Old Fart"
Hacker, CTO, Founder, Investor
Bei Mayflower GmbH
Schlechter Entwickler, darf aber gelegentlich noch mitspielen
Auf der letzten KI Navigator durfte ich auch mitspielen.

Von Diven,

Souffleusen und Regie

https://t.ly/1Luly

Goldman Sachs Study, a.k.a
"Who to fire next"

"The future top coding language will be English."

Coatue AI Full Report Nov 2023, https://drive.google.com/file/d/1gQhYT7j6b2wJmrFZHNeQgTiWPyTsjOfX/view

Meanwhile, in our Companies...

Eventuell nur ein Hype?

Internet?

E-Commerce?
Mobiletelefonie?
Cloud?

Through of Disillusionment

Wenn es nicht funktioniert, warum geben die so viel Geld aus?

Wenn es so gut ist, warum funktioniert es nicht bei mir?

Der Weg zu AI

👶2023: Information & Orientation
👦2024: Experimente und Chatbots
🧑2024: Produktivanwendungen
💑2025: Workflow-Lösungen
🧓2026ff: AI-Organisation

👶 2023: Information & Orientierung

Konferenzen besuchen
Recherche und Austausch
Private Nutzung vom ChatGPT
Individuelle Experimente

👶 "Wir machen schon ganz lange AI"

Die GenAI vs ML-Verwirrung

Predictive Maintenance
Recommendation
Sentiment Analysis
Data Analytics
Graph-Datenbanken
Intent-Chatbots
OCR

Wir müssen NVidia-Karten kaufen!

👶 Infrastruktur & Organisation

Wir haben keine Infrastruktur.
Wir haben keine Organisation.
Wir haben keine Regeln zum Einsatz.
Maximal ein Verbot das zu benutzen.
Kollegen nutzen es trotzdem heimlich.

👦2024: Experimente & Chatbots

Copilot / ChatGPT als offizielles Werkzeug
SupportBot auf Website
"Chat mit eigenen Dokumenten"
Recherche-Queries, NQL
Conversional:
- Chat
- Voice
- Mail
- Post
- Für Deutschland: Fax

👦MeinGPT

Meist nur ein dünner OpenAI-Wrapper
Kostet soviel wie ein dünner Wrapper
Motivation: Datenschutz und "GDPR-konform aus Deutschland"
Microsoft als Plattform vs. Microsoft als Plattform
Klarer Produktivätszugewinn
Preiswerter als Nutzerlizenzen :-)

👦GPTs/ RAG

"Chat with your Documents"

Hält das, was interne
- Wikis
- Knowledgemanagement-Systeme
- Mitarbeiterportale
- Dokumentationsysteme
seit 2000 versprochen haben

👦Organisation & IT

Organisation:

Guidelines für Kollegen
Erfahrungensaustausch
Compliance & Datenschutz geklärt
Teilaufgaben werden über AI gelöst und beschleunigt

IT: unverändert

Chatbots sind das Ford Model T der AI.

Mehr als nur ein schnelleres Pferd
Flexibel und kann mehr transportieren.
Kann flexibel angepasst und schnell repariert werden
Das Auto von heute sieht trotzdem anders aus.

"echte Projekte" mit
"echten" (externen) Nutzern und
realem Nutzen
Zusammen mit Early Adoptern,
Friends & Family
verlässlich
verfügbar
gewartet

"Nur Intern war schöner."

🧑2024: Produktivlösungen

Infrastruktur-Integration
Observability
LLMOps
- LangFuse, LangSmith
- LLM Proxy
Update-Strategien ...

🧑Ooops, wir brauchen Infrastruktur

Wird jede Antwort gefunden?
Ist die Antwort inhaltlich und formell korrekt?
ELT-Pipelines für Dokumente
Transformation und Chunking nach Dokumententyp
Data Pipelines für Datenbanken
Gezielte Embeddings, jede Woche neue und bessere
Spezialisierte Retriever
Reranking-Modelle
und Testing ....

🧑 RAG Realitycheck

Nichtdeterministisch
Qualität sichern

Prozentual richtig statt korrekt
Qualität und Verlässlichkeit entstehen durch Lernen
Back-Testing aus Produktionsdaten
Pairwise Testing - ist a oder b besser?
LLM as a Judge

Security: Alles was die Owasp Top 10 hergibt
Testen auf
- Korrektheit
- Toxische Daten
- Sicherheitsrisiken
Verlässlichkeit
- Grounding
- Testing-Frameworks

🧑 Ooops, wir brauchen Security

Sie halluzinieren immer noch.
Sie können nur einfachste Aufgaben erledigen.
Für komplexe Aufgaben braucht es einen Menschen
zum Gegenprüfen, Anpassen und Korrigieren.

🧑Kritik an den Lösungen

System 1: Automatisch, unreflektiert, unbewusst.
System 2: bewusst, gezielt, reflektiert, selbstkritisch,
analytisch und informiert

https://www.linkedin.com/pulse/state-autonomous-ai-agents-dean-meyer/

Warum sind Menschen verlässlich?

Erst planen, dann machen...

https://github.com/langchain-ai/langgraph/blob/main/examples/rewoo/rewoo.ipynb

Selbstkritisch noch mal prüfen

https://github.com/langchain-ai/langgraph/blob/main/examples/reflection/reflection.ipynb

https://arxiv.org/abs/2404.10952v1

https://langchain-ai.github.io/langgraph/tutorials/usaco/usaco/

Systematisch und reflektiert vorgehen

Human in the loop

Frag Deinen Menschen.

A Generative AI Agent
is defined as an application
that tries to achieve a goal by
observing the world and acting

upon it using the tools it

has at his disposal

Human-in-the-Loop statt Chat
besser: keine Nutzerinteraktion
Eventgetrieben
Queues von Aufgaben
Vollständige Prozesse als
Folgen von Aufgaben

💑2025: Workflow-Lösungen

Agenten, die nicht
nur assistieren.

Wie man autonome Agenten baut

Perception & Tools

Aktuell:

Alle Dokumente
Alle Bilder
Alle Töne
Alle APIs
Alle Datenbanken
Alle Dienste

Bald:

Dein Desktop
Dein Telefon
Roboter

Strategie & Planung

o1-Vorschau: Pläne bewerten, bevor gehandelt wird
Wer hat o1 die Strategien beigebracht?
Wer bringt Agenten die Strategie bei?

Entscheidungen

Haben wir unser Ziel erreicht?
Welches Tool sollten wir als Nächstes ausprobieren
Befinden wir uns in einer Schleife?
Ist das Ergebnis des Tools hilfreich?

Memory

Kurzzeitgedächtnis

„Was muss ich wissen,
um diese Entscheidung zu treffen?“
„Was brauche ich,
um meine nächsten Schritte zu planen?“
Meistens Prompt, aktuelle Session

Langzeitgedächtnis

Welche Strategie hat tatsächlich funktioniert?
Welche Strategie ist schiefgelaufen?
Welche Schritte waren nutzlos?
Meistens Vektordatenbank
Shared zwischen Sessions

Lernen & Optimieren

Der Grund, warum Strawberrys Rs kein Problem mehr ist:

Reflexion
Feedback-Schleifen
Backtesting
RLHF (Reinforcement Learning from Human Feedback)
Funktionierende Strategien
Generalisieren
Optimieren

Warum brauchen wir einen Monat zum Einarbeiten?

💑2025: Workflows digitalisieren

Die meisten Strategien sind Lernwissen
die meisten Werkzeuge sind Lernwissen
Prüfungen und Kontrollen passieren implizit
Dazulernen passiert implizit
Generalisieren und Optimieren passiert implizit.

Genau dieses Wissen müssen wir digitalisieren.

💑2025: Workflows digitalisieren

Konkrete Todos:

Prozess erfassen und zerlegen
Agenten integrieren
ihn lernen lassen :-)
Selbst agieren lassen.

Domänenwissen ist deutlich
umfangreicher als bei normaler IT.

💑2025: AI Platform: Dezentral
Workflows digitalisieren

Da ist sie wieder, die Schatten-IT
(Copilot Studio für alle!)
Plattform-Engineering für AI:
- Self-Service für die Fachteams
- IDM & Rechte integriert
- Einfache Bereitstellung von Vektordatenbanken
- Einfache Integration eigener Tools

SQL per Agent erstellen kann jeder, aber ...

💑2025: Daten nutzen

Der Humanoid findet selbst die richtige Datenquelle
Er findet selbst die aktuellen Daten dort
Er plausibilisiert die Daten durch angucken
Er merkt sich das fürs nächste Mal

Sales: Mein Agent soll in CRM, in ERP und im Kundenservice gucken, was Thema ist.

💑2025: Data Meshes/Fabrics

Datenkatalog
Datenverträge
Föderierte Governance
Self-Service Daten nutzen
Self-Service Daten bereitstellen

Ok, mühsam,
lohnt sich das denn?

💑 Industrialisierung und das Auto

Automatisierung der Produktion:
10.000 Fahrzeuge pro Tag
Ein Ford Model T wurde in
93 Minuten vollständig produziert
Die Preise konnten in 5 Jahren von
950$ auf 360$ gesenkt werden

💑Elastische Wissensarbeit

1000 individualisierte Bewerbungen schicken statt 5
Alle Angebote der eigenen Kunden online prüfen und mögliche Vorprodukte anbieten
20 neue Shops integrieren pro Monat statt 2
Alle Stellenausschreibungen prüfen als Vermittler statt nur eine
20.000 Produktblätter pro Tag übersetzen statt 20

💑"Levels of AGI"

No AI	Emerging	Competent	Expert	Virtuoso	Superhuman
Verfügbar	Verfügbar	Verfügbar	Verfügbar	Emerging	Emerging
	* 1,1	*2,0	*10	*100	?

Größter Effekt,
heute erreichbar.

https://arxiv.org/pdf/2311.02462

🧓AI-Organisation:
Kooperierende Agenten

https://x.com/ericmbroda

💑2026: Agentic Meshes

https://x.com/ericmbroda

💑2026: Agentic Meshes

https://x.com/ericmbroda

💑Vorgestern, auf der Ignite

Todos 2025

👶Jeder hat AI-Access.
👦Alle relevanten Daten sind verfügbar
🧑Alle relevanten Services sind verfügbar
💑AI-Platform-Team und AI-Platform
🧓Self-Service-Training

Alternativ: Microsoft All in

Fazit

Kann ich das heute schon einsetzen?
Ja, aber es lohnt noch nicht überall.
Wird das uns den Job wegnehmen?
Einen Teil des Jobs, und nicht nur uns.
Wie lange wird das dauern?
Es hat schon angefangen, dann zwischen 1 und 10 Jahren. Vielleicht.
Wo finde ich Informationen dazu?
LangGraph, towardsdatascience.com, Microsoft Magentic One

KI Navigator: Hitchhikers Guide

By Johann-Peter Hartmann

KI Navigator: Hitchhikers Guide

Wir haben jetzt CompanyGPT gelaunched und arbeiten gerade an internen RAG. Wir haben auch erste Pilotteams, die da Vorreiter sind, und einen Arbeitskreis, der mit AWS über Ki spricht. Sind wir damit dann durch?

Hitchhikers Guide to Corporate AI

Von Diven,

Souffleusen und Regie

Goldman Sachs Study, a.k.a "Who to fire next"

"The future top coding language will be English."

Meanwhile, in our Companies...

Eventuell nur ein Hype?

Internet?

E-Commerce? Mobiletelefonie? Cloud?

Through of Disillusionment

Wenn es nicht funktioniert, warum geben die so viel Geld aus?

Wenn es so gut ist, warum funktioniert es nicht bei mir?

Der Weg zu AI

👶2023: Information & Orientation

👦2024: Experimente und Chatbots

🧑2024: Produktivanwendungen

💑2025: Workflow-Lösungen

🧓2026ff: AI-Organisation

👶 2023: Information & Orientierung

👶 "Wir machen schon ganz lange AI"

👶 Infrastruktur & Organisation

👦2024: Experimente & Chatbots

👦MeinGPT

👦GPTs/ RAG

👦Organisation & IT

Chatbots sind das Ford Model T der AI.

🧑2024: Produktivlösungen

🧑Ooops, wir brauchen Infrastruktur

🧑 RAG Realitycheck

Nichtdeterministisch Qualität sichern

🧑 Ooops, wir brauchen Security

Sie halluzinieren immer noch.

Sie können nur einfachste Aufgaben erledigen.

Für komplexe Aufgaben braucht es einen Menschen zum Gegenprüfen, Anpassen und Korrigieren.

🧑Kritik an den Lösungen

System 1: Automatisch, unreflektiert, unbewusst.

System 2: bewusst, gezielt, reflektiert, selbstkritisch, analytisch und informiert

Warum sind Menschen verlässlich?

Erst planen, dann machen...

Selbstkritisch noch mal prüfen

Systematisch und reflektiert vorgehen

Human in the loop

Frag Deinen Menschen.

💑2025: Workflow-Lösungen

Wie man autonome Agenten baut

Perception & Tools

Strategie & Planung

Entscheidungen

Memory

Lernen & Optimieren

Der Grund, warum Strawberrys Rs kein Problem mehr ist:

Warum brauchen wir einen Monat zum Einarbeiten?

💑2025: Workflows digitalisieren

Die meisten Strategien sind Lernwissen

die meisten Werkzeuge sind Lernwissen

Prüfungen und Kontrollen passieren implizit

Dazulernen passiert implizit

Generalisieren und Optimieren passiert implizit.

Genau dieses Wissen müssen wir digitalisieren.

💑2025: Workflows digitalisieren

Domänenwissen ist deutlich umfangreicher als bei normaler IT.

💑2025: AI Platform: Dezentral Workflows digitalisieren

Da ist sie wieder, die Schatten-IT (Copilot Studio für alle!)

Plattform-Engineering für AI:

Self-Service für die Fachteams

IDM & Rechte integriert

Einfache Bereitstellung von Vektordatenbanken

Einfache Integration eigener Tools

SQL per Agent erstellen kann jeder, aber ...

💑2025: Daten nutzen

Der Humanoid findet selbst die richtige Datenquelle

Er findet selbst die aktuellen Daten dort

Er plausibilisiert die Daten durch angucken

Er merkt sich das fürs nächste Mal

Sales: Mein Agent soll in CRM, in ERP und im Kundenservice gucken, was Thema ist.

💑2025: Data Meshes/Fabrics

Datenkatalog

Datenverträge

Föderierte Governance

Self-Service Daten nutzen

Goldman Sachs Study, a.k.a
"Who to fire next"

E-Commerce?
Mobiletelefonie?
Cloud?

Nichtdeterministisch
Qualität sichern

Für komplexe Aufgaben braucht es einen Menschen
zum Gegenprüfen, Anpassen und Korrigieren.

System 2: bewusst, gezielt, reflektiert, selbstkritisch,
analytisch und informiert

Domänenwissen ist deutlich
umfangreicher als bei normaler IT.

💑2025: AI Platform: Dezentral
Workflows digitalisieren

Da ist sie wieder, die Schatten-IT
(Copilot Studio für alle!)

Ok, mühsam,
lohnt sich das denn?

🧓AI-Organisation:
Kooperierende Agenten