Hitchhikers Guide to Corporate AI

Hi!
 

  • Dev-Level "Old Fart"
  • Hacker, CTO, Founder, Investor
  • Bei Mayflower GmbH
  • Schlechter Entwickler, darf aber gelegentlich noch mitspielen
     
  • Auf der letzten KI Navigator durfte ich auch mitspielen.

Von Diven, 

Souffleusen und Regie

https://t.ly/1Luly

Goldman Sachs Study, a.k.a
"Who to fire next"

"The future top coding language will be English."

Coatue AI Full Report Nov 2023, https://drive.google.com/file/d/1gQhYT7j6b2wJmrFZHNeQgTiWPyTsjOfX/view

Meanwhile, in our Companies...

Eventuell nur ein Hype?

Internet?

E-Commerce?
Mobiletelefonie?
Cloud?

Through of Disillusionment

Wenn es nicht funktioniert, warum geben die so viel Geld aus?

Wenn es so gut ist, warum funktioniert es nicht bei mir?

Der Weg zu AI

  1. 👶2023: Information & Orientation

  2. 👦2024: Experimente und Chatbots

  3. 🧑2024: Produktivanwendungen

  4. 💑2025: Workflow-Lösungen

  5. 🧓2026ff: AI-Organisation

👶 2023: Information & Orientierung

  • Konferenzen besuchen
  • Recherche und Austausch
  • Private Nutzung vom ChatGPT
  • Individuelle Experimente

👶 "Wir machen schon ganz lange AI"

Die GenAI vs ML-Verwirrung

  • Predictive Maintenance
  • Recommendation
  • Sentiment Analysis
  • Data Analytics
  • Graph-Datenbanken
  • Intent-Chatbots
  • OCR

 

Wir müssen NVidia-Karten kaufen!

👶 Infrastruktur & Organisation

  • Wir haben keine Infrastruktur.
     
  • Wir haben keine Organisation.
     
  • Wir haben keine Regeln zum Einsatz.
    Maximal ein Verbot das zu benutzen.

     
  • Kollegen nutzen es trotzdem heimlich.

👦2024: Experimente & Chatbots

  • Copilot / ChatGPT als offizielles Werkzeug
  • SupportBot auf Website 
  • "Chat mit eigenen Dokumenten"
  • Recherche-Queries, NQL
     
  • Conversional: 
    • Chat
    • Voice
    • Mail
    • Post
    • Für Deutschland: Fax

👦MeinGPT

  • Meist nur ein dünner OpenAI-Wrapper
  • Kostet soviel wie ein dünner Wrapper
     
  • Motivation: Datenschutz und "GDPR-konform aus Deutschland"
  • Microsoft als Plattform vs. Microsoft als Plattform
  • Klarer Produktivätszugewinn
  • Preiswerter als Nutzerlizenzen :-)

👦GPTs/ RAG 

"Chat with your Documents"

 

  • Hält das, was interne 
    • Wikis
    • Knowledgemanagement-Systeme
    • Mitarbeiterportale
    • Dokumentationsysteme
  • seit 2000 versprochen haben 

👦Organisation & IT

Organisation:

  • Guidelines für Kollegen
  • Erfahrungensaustausch
  • Compliance & Datenschutz geklärt 
  • Teilaufgaben werden über AI gelöst und beschleunigt
     

IT: unverändert

Chatbots sind das Ford Model T der AI.

  • Mehr als nur ein schnelleres Pferd
  • Flexibel und kann mehr transportieren.
  • Kann flexibel angepasst und schnell repariert werden
     
  • Das Auto von heute sieht trotzdem anders aus.
  • "echte Projekte" mit
    "echten" (externen) Nutzern und
    realem Nutzen
     
  • Zusammen mit Early Adoptern,
    Friends & Family
     
  • verlässlich
  • verfügbar
  • gewartet

 

"Nur Intern war schöner."

🧑2024: Produktivlösungen

 

  • Infrastruktur-Integration
  • Observability
  • LLMOps
    • ​LangFuse, LangSmith
    • LLM Proxy
  • Update-Strategien ...

🧑Ooops, wir brauchen Infrastruktur

  • Wird jede Antwort gefunden?
  • Ist die Antwort inhaltlich und formell korrekt?
     
  • ELT-Pipelines für Dokumente
  • Transformation und Chunking nach Dokumententyp
  • Data Pipelines für Datenbanken
  • Gezielte Embeddings, jede Woche neue und bessere 
  • Spezialisierte Retriever
  • Reranking-Modelle
  • und Testing ....

 

🧑 RAG Realitycheck

Nichtdeterministisch
Qualität sichern

  1. Prozentual richtig statt korrekt
  2. Qualität und Verlässlichkeit entstehen durch Lernen
  3. Back-Testing aus Produktionsdaten
  4. Pairwise Testing - ist a oder b besser?
  5. LLM as a Judge
  • Security: Alles was die Owasp Top 10 hergibt
     
  • Testen auf 
    • Korrektheit
    • Toxische Daten
    • Sicherheitsrisiken
  • Verlässlichkeit
    • Grounding
    • Testing-Frameworks

🧑 Ooops, wir brauchen Security

  • Sie halluzinieren immer noch.
     

  • Sie können nur einfachste Aufgaben erledigen.
     

  • Für komplexe Aufgaben braucht es einen Menschen
    zum Gegenprüfen, Anpassen und Korrigieren.

🧑Kritik an den Lösungen

  • System 1: Automatisch, unreflektiert, unbewusst.
     

  • System 2: bewusst, gezielt, reflektiert, selbstkritisch,
    analytisch und informiert

https://www.linkedin.com/pulse/state-autonomous-ai-agents-dean-meyer/

Warum sind Menschen verlässlich?

Erst planen, dann machen...

https://github.com/langchain-ai/langgraph/blob/main/examples/rewoo/rewoo.ipynb

Selbstkritisch noch mal prüfen

https://github.com/langchain-ai/langgraph/blob/main/examples/reflection/reflection.ipynb

https://arxiv.org/abs/2404.10952v1

https://langchain-ai.github.io/langgraph/tutorials/usaco/usaco/

Systematisch und reflektiert vorgehen

Human in the loop

Frag Deinen Menschen.

A Generative AI Agent
is defined as an application 
that tries to achieve a goal by
observing the world and acting

upon it using the tools it

has at his disposal

  • Human-in-the-Loop statt Chat
  • besser: keine Nutzerinteraktion
  • Eventgetrieben
  • Queues von Aufgaben
  • Vollständige Prozesse als
    Folgen von Aufgaben

💑2025: Workflow-Lösungen

Agenten, die nicht
nur assistieren.

Wie man autonome Agenten baut

Perception & Tools

Aktuell:

  • Alle Dokumente
  • Alle Bilder
  • Alle Töne
  • Alle APIs
  • Alle Datenbanken
  • Alle Dienste

Bald:

  • Dein Desktop       
  • Dein Telefon
  • Roboter

Strategie & Planung

  • o1-Vorschau: Pläne bewerten, bevor gehandelt wird

  • Wer hat o1 die Strategien beigebracht?

  • Wer bringt Agenten die Strategie bei?

Entscheidungen

  • Haben wir unser Ziel erreicht?
     
  • Welches Tool sollten wir als Nächstes ausprobieren
  • Befinden wir uns in einer Schleife?
     

  • Ist das Ergebnis des Tools hilfreich?
     

Memory

Kurzzeitgedächtnis

  • „Was muss ich wissen,
    um diese Entscheidung zu treffen?“
  • „Was brauche ich,
    um meine nächsten Schritte zu planen?“
  • Meistens Prompt, aktuelle Session

Langzeitgedächtnis

  • Welche Strategie hat tatsächlich funktioniert?
  • Welche Strategie ist schiefgelaufen?
  • Welche Schritte waren nutzlos?
  • Meistens Vektordatenbank
  • Shared zwischen Sessions 

Lernen & Optimieren

Der Grund, warum Strawberrys Rs kein Problem mehr ist:

  • Reflexion
  • Feedback-Schleifen
  • Backtesting
  • RLHF (Reinforcement Learning from Human Feedback)
  • Funktionierende Strategien
  • Generalisieren
  • Optimieren

Warum brauchen wir einen Monat zum Einarbeiten?

💑2025: Workflows digitalisieren

  • Die meisten Strategien sind Lernwissen

  • die meisten Werkzeuge sind Lernwissen

  • Prüfungen und Kontrollen passieren implizit

  • Dazulernen passiert implizit

  • Generalisieren und Optimieren passiert implizit.

Genau dieses Wissen müssen wir digitalisieren.

💑2025: Workflows digitalisieren

Konkrete Todos:

  1. Prozess erfassen und zerlegen

  2. Agenten integrieren

  3. ihn lernen lassen :-) 

  4. Selbst agieren lassen.

Domänenwissen ist deutlich
umfangreicher als bei normaler IT.

💑2025: AI Platform: Dezentral
                Workflows digitalisieren

  • Da ist sie wieder, die Schatten-IT
    (Copilot Studio für alle!)
     

  • Plattform-Engineering für AI: 

    • Self-Service für die Fachteams

    • IDM & Rechte integriert

    • Einfache Bereitstellung von Vektordatenbanken

    • Einfache Integration eigener Tools

SQL per Agent erstellen kann jeder, aber ... 

💑2025: Daten nutzen

  • Der Humanoid findet selbst die richtige Datenquelle

  • Er findet selbst die aktuellen Daten dort

  • Er plausibilisiert die Daten durch angucken

  • Er merkt sich das fürs nächste Mal

Sales: Mein Agent soll in CRM, in ERP und im Kundenservice gucken, was Thema ist.

💑2025: Data Meshes/Fabrics

  • Datenkatalog

  • Datenverträge

  • Föderierte Governance

  • Self-Service Daten nutzen

  • Self-Service Daten bereitstellen

Ok, mühsam,
lohnt sich das denn?

💑 Industrialisierung und das Auto

  • Automatisierung der Produktion:
    10.000 Fahrzeuge pro Tag

     
  • Ein Ford Model T wurde in
    93 Minuten vollständig produziert

     
  • Die Preise konnten in 5 Jahren von
    950$ auf 360$ gesenkt werden

💑Elastische Wissensarbeit

  • 1000 individualisierte Bewerbungen schicken statt 5
     
  • Alle Angebote der eigenen Kunden online prüfen und mögliche Vorprodukte anbieten
     
  • 20 neue Shops integrieren pro Monat statt 2
     
  • Alle Stellenausschreibungen prüfen als Vermittler statt nur eine
     
  • 20.000 Produktblätter pro Tag übersetzen statt 20

💑"Levels of AGI"

No AI Emerging Competent Expert Virtuoso Superhuman
Verfügbar Verfügbar Verfügbar Verfügbar Emerging Emerging
* 1,1 *2,0  *10 *100 ?

Größter Effekt,
heute erreichbar.

https://arxiv.org/pdf/2311.02462

🧓AI-Organisation:
     Kooperierende Agenten

https://x.com/ericmbroda

💑2026: Agentic Meshes

https://x.com/ericmbroda

💑2026: Agentic Meshes

https://x.com/ericmbroda

💑Vorgestern, auf der Ignite

Todos 2025

  1. 👶Jeder hat AI-Access.

  2. 👦Alle relevanten Daten sind verfügbar

  3. 🧑Alle relevanten Services sind verfügbar

  4. 💑AI-Platform-Team und AI-Platform

  5. 🧓Self-Service-Training

Alternativ: Microsoft All in

Fazit

  • Kann ich das heute schon einsetzen?
    Ja, aber es lohnt noch nicht überall.
     
  • Wird das uns den Job wegnehmen?
    Einen Teil des Jobs, und nicht nur uns.
     
  • Wie lange wird das dauern?
    Es hat schon angefangen, dann zwischen 1 und 10 Jahren. Vielleicht.
     
  • Wo finde ich Informationen dazu?
    LangGraph, towardsdatascience.com, Microsoft Magentic One

KI Navigator: Hitchhikers Guide

By Johann-Peter Hartmann

KI Navigator: Hitchhikers Guide

Wir haben jetzt CompanyGPT gelaunched und arbeiten gerade an internen RAG. Wir haben auch erste Pilotteams, die da Vorreiter sind, und einen Arbeitskreis, der mit AWS über Ki spricht. Sind wir damit dann durch?

  • 12