Ar-Ge Teşvikleri Yönetim Sistemi

Proje Sunumu

Triton Mühendislik

  • Konum: Bolu Teknokent bünyesinde faaliyet gösteren teknoloji firması
  • Uzmanlık Alanları:
    • Yazılım geliştirme
    • Danışmanlık hizmetleri
    • Devlet destekleri ve finansal danışmanlık
    • Özgün yazılım çözümleri geliştirme

Mevcut Durum Analizi

Ar-Ge Merkezleri, Tasarım Merkezleri ve Teknopark Firmaları

  • 5746 ve 4691 sayılı kanunlar kapsamındaki teşvik süreçleri
  • Manuel yöntemler veya Excel tabanlı sistemler ile yürütülmekte
  • Kritik hesaplamalarda hata ve iptal riski yüksek

Kritik Hesaplama Alanları

  • Adam-ay hesaplamaları
  • Ar-Ge günü hesaplamaları
  • SGK teşvik matrahı
  • Gelir ve damga vergisi terkinleri
  • Proje-personel eşleştirmeleri
  • Fatura-Sanayi ve Teknoloji Bakanlığı doğrulamaları

Kullanıcı Deneyimi Sorunları

  • Karmaşık Mevzuat: 5746/4691/5510 sayılı kanunların karmaşıklığı
  • Sürekli Değişim: Yönetmelik ve tebliğlerdeki güncellemeler
  • Teknik Dil: Hukuki terimlerin anlaşılması zorluğu
  • Bağlam Eksikliği: Kuralların pratik uygulamalarının belirsizliği

Kural Motoru Avantajları

Operasyonel Faydalar

  • Mevzuat Uyumu: Yeni girilen veya güncellenen verilerin ilgili olduğu kuralların otomatik olarak çalıştırılıp denetlenmesi; böylece tüm süreçlerde mevzuata uygunluk, sürekli ve kesintisiz bir şekilde sağlanır
  • Hata Minimizasyonu: ≥ %99 tespit hassasiyeti
  • Güncellenebilirlik: Parametrik yapı sayesinde kolay adaptasyon

LLM Asistan Çözümü

Kendi Kendine Öğrenme Platformu

  • Doğal Dil Sorguları: "Ar-Ge gününde ücretsiz izin geçerli mi?"
  • Bağlamsal Yanıtlar: Mevzuat referansları ile açıklamalar
  • Pratik Örnekler: Gerçek senaryolar üzerinden öğrenme
  • Sürekli Güncelleme: Yeni mevzuat değişikliklerinin otomatik entegrasyonu

Proje Hedefi

"Ar-Ge Teşvikleri Yönetim Sistemi"

  • Mevzuata tam uyumlu
  • Denetlenebilir
  • Otomatik çalışabilen yazılım platformu
  • LLM Asistanı ile kullanıcıya özel rehberlik

Projenin Amacı

  • 5746 ve 4691 kapsamındaki teşvik süreçlerini uçtan uca dijitalleştiren, mevzuata tam uyumlu ve denetlenebilir bir platform geliştirmek.
  • Parametrik kural motoru ile gerçek zamanlı uyum denetimi; SGK ve vergi hesap motorları ile otomatik ve hatasız dağıtımlar sağlamak.
  • RAG/GraphRAG ve Chain-of-Verification (CoVe) destekli AI danışman ile mevzuata dayalı, açıklanabilir ve kaynak gösterimli yanıtlar üretmek.
  • Kurumların teşvik kaybını azaltmak, denetimlerde izlenebilirliği artırmak ve operasyonel verimliliği yükseltmek.

Çözüm Yaklaşımı

1. Veri Toplama ve Hazırlık

1.1 Kullanıcı Verileri (PostgreSQL)

  • Personel bilgileri, maaş verileri, proje atamaları
  • Bordro kayıtları, izin bilgileri, çalışma süreleri
  • Finansal veriler ve teşvik hesaplamaları

1.2 Mevzuat Bilgileri (Neo4j)

  • 5746 ve 4691 sayılı kanun metinleri ve yorumları
  • Mevzuat ilişkileri ve çapraz referanslar
  • Güncel tebliğ ve yönetmelik bilgileri

1.3 Kurallar

  • 150+ parametrik kural tanımı
  • Teşvik hesaplama formülleri ve koşulları
  • İş kuralları ve validasyon kriterleri

1.4 Diğer Bilgiler (ERP Entegrasyonları)

  • Logo, Mikro, Paraşüt sistemleriyle çift yönlü API bağlantıları
  • Harici veri kaynakları ve üçüncü parti servisler
  • Sistem entegrasyonları ve veri senkronizasyonu

Çözüm Yaklaşımı (Devam)

2. Kural Motoru Kodlama

  • Saf Fonksiyonlar: Yan etki olmayan deterministik kurallar
  • Bağımlılık Yönetimi: Otomatik yeniden hesaplama
  • Loglama ve İzlenebilirlik: Tam şeffaflık için detaylı kayıt
  • BoundaryML Entegrasyonu: LLM'nin fonksiyon ve şema anlayışını mümkün hale getirme

Çözüm Yaklaşımı (Devam)

3. Hibrit AI Veri Erişim Sistemi

  • Table-Augmented Generation: Prisma ORM şemaları ile SQL dönüşümü
  • Whitelisted SQL: Güvenli SQL işlemleri
  • Row Level Security: RBAC ile veri güvenliği
  • GraphRAG + Neo4j: Mevzuat ilişkileri ve çoklu atlama

Çözüm Yaklaşımı (Devam)

4. LLM Test ve Doğrulama

  • Entegre AI Agent: Gerçek senaryolar ile test
  • Golden Test Set: Benchmark oluşturma
  • Chain-of-Verification: %35-90 hata azaltma
  • Multi-Agent Consensus: Güvenilirlik artırma

Teknik Detaylar: Hibrit Veri Mimarisi

Table-Augmented Generation (TAG)

Kullanıcı verilerini PostgreSQL'den çeker ve LLM'ye verir.

  • Sorgu Sentezi: Doğal dil → SQL dönüşümü (Prisma ORM şemaları yardımıyla)
  • Sorgu Yürütme: PostgreSQL'de işlem yapma
  • Veri Birleştirme: Çoklu sorgu / tablo birleştirmeleri
  • Doğal Dil Üretimi: İnsan okunabilir yanıtlar

Avantajlar: %35-90 halüsinasyon azaltma, gerçek zamanlı veri erişimi, sayısal doğruluk, veri analizi, PostgreSQL RBAC ve Row Level Security ile veri güvenliği sağlanır.

Teknik Detaylar: GraphRAG Sistemi

Neo4j Grafik Veritabanı

İndeksleme Fazı

  • Metin segmentasyonu (cümle/paragraf bazında)
  • Varlık/ilişki çıkarımı (LLM ile)
  • Grafik oluşturma (düğümler + kenarlar)
  • Topluluk kümeleme (Leiden algoritması)
  • Özetleme (her topluluk için)

Sorgu Fazı

Global Arama: Geniş kapsamlı sorular için tüm bilgi ağını tarar

  • Örnek: "Ar-Ge teşvikleri hakkında genel bilgi ver"
  • Kullanım: Kapsamlı özetler ve trend analizleri için

Yerel Arama: Spesifik varlıkların detaylarına odaklanır

  • Örnek: "5746 sayılı kanunun 3. maddesi ne diyor?"
  • Kullanım: Kesin bilgiler ve spesifik kanun maddeleri için

DRIFT Arama: Yerel sonuçları ilgili bağlamla zenginleştirir

  • Örnek: "SGK teşvik hesabı nasıl yapılır?" (teşvik + ilgili kanunlar + uygulama örnekleri)
  • Kullanım: Bağlamsal yanıtlar ve ilişkili bilgiler için

Performans Kazanımları:

  • %35-90 doğruluk artışı (geleneksel RAG'e göre)
  • %25 daha yüksek başarı oranı
  • Bağlamsal zenginlik sayesinde daha kapsamlı yanıtlar

Performans: %35-90 doğruluk artışı, %25 daha yüksek başarı oranı

Örnek Sorgu

"Ar-Ge personelim için SGK teşviki nasıl hesaplanır?"

  1. Kontekst Belirleme: Sorgudaki "Ar-Ge personeli" ifadesinden kurum tipini (Ar-Ge Merkezi) ve ilgili kanunu (5746 sayılı kanun) tespit eder
  2. Yerel Arama: Bağlama uygun "Ar-Ge personeli" ve "SGK teşviki (5746)" düğümlerini bulur - yanlış kontekstteki (4691 sayılı kanun) düğümleri hariç tutar
  3. İlişki Analizi: Ar-Ge personeli ile 5746 kapsamındaki SGK teşvik kuralları arasındaki spesifik bağlantıları inceler
  4. Global/Topluluk Bağlamı: "5746 SGK Teşvikleri" kümesinden ek bilgi alır, diğer kanunların teşviklerini (4691) hariç tutar
  5. Çoklu Atlama: Doğru kanun maddelerine (5746/3), hesaplama formüllerine ve Ar-Ge spesifik şartlara atlar
  6. Birleştirme: Bağlama uygun tüm bilgileri birleştirerek kapsamlı yanıt üretir

Bu sistem sayesinde kullanıcı sadece "SGK teşviki" genel bilgisi değil, aynı zamanda kurum tipine özel "nasıl hesaplandığı", "hangi kanun maddesine dayandığı" ve "Ar-Ge şartlarına uygunluğu" gibi bağlamsal bilgileri alır.

Teknik Detaylar: AI Agent İş Akışı ve Doğrulama Sistemi

Farklı Sorgu Karmaşıklıklarına Göre Doğrulama Stratejileri

Sorgu Tipi Karmaşıklık Veri Kaynağı Doğrulama Yöntemi Hedef Güven Skoru Örnek
Basit Veri Sorgu Düşük PostgreSQL Direkt Doğrulama >%95 "Geçen ay toplam teşvik?"
Teknik Hesaplama Orta Kural Motoru CoVe + Self-Correction >%90 "SGK matrah hesabı?"
Mevzuat Açıklaması Yüksek GraphRAG CoVe + Multi-Model >%85 "Kanun maddesi yorumu?"
Çoklu İlişki Çok Yüksek Hibrit Sistem Tüm Yöntemler >%80 "Firma stratejisi analizi?"

Gerçek Dünyada AI Agent Örneği

Kullanıcı Sorusu: "Ar-Ge merkezinde çalışan Ahmet'in maaşı için ne kadar SGK teşviki alabilirim?"

AI Agent İş Akışı:

  1. Araç Seçimi ve Planlama

    • LLM sorguyu analiz eder ve gerekli araçları belirler
    • TAG, GraphRAG ve Kural Motoru araçlarını seçer
  2. Araç Yürütümü

    • TAG ile PostgreSQL'den Ahmet'in bordro verilerini çek
    • GraphRAG ile 5746 sayılı kanun SGK teşvik kurallarını tara
    • Kural motorunu çağırarak teşvik hesaplama formüllerini (nasıl hesaplandı bilgisi) ve sonucu al (Tool Calling)
  3. Veri İşleme ve Yanıt Üretimi

    • Araç sonuçlarını birleştirerek LLM ile doğal dil yanıtı üret
  4. Güven Skoru Hesaplama

    • Bir veya birden fazla yöntem kullanılabilir
    • Multi-Model Consensus: GPT-4, Claude 3 ile karşılaştır (85% benzerlik)
    • Semantic Entropy: Çoklu yanıt üretiminde anlamsal tutarlılığı ölçer (farklı kelimelerle aynı anlam = düşük entropi = yüksek güven)
    • Final Güven Skoru: Skora göre farklı akışlar uygulanır

Güven Skoru >90% - Direkt Teslim Akışı

Örnek Senaryo: "Geçen ay toplam SGK teşviki ne kadar oldu?"

  1. Yüksek Güven - Direkt Yanıt
    • Güven skoru >90% olduğu için doğrulama gerekli değil
    • Kullanıcıya doğrudan yanıt verilir
    • Sonuç: Hızlı ve güvenilir yanıt

Güven Skoru 70-90% - Hafif Doğrulama Akışı

Örnek Senaryo: "Ar-Ge merkezinde çalışan Ahmet'in maaşı için ne kadar SGK teşviki alabilirim?" (82% güven skoru)

  1. Orta-Yüksek Güven - Self-Correction Loop

    • Hafif düzeyde doğrulama uygulanır
    • Doğrulama soruları oluştur: "5746 sayılı kanunda SGK teşvik oranı ne?"
    • GraphRAG ile soruları bağımsız olarak yanıtla
    • Orijinal yanıtı doğrula ve gerekirse rafine et
  2. Final Yanıt

    • Kaynak gösterimi ile kullanıcıya sunulur
    • Sonuç: Dengeli hız ve doğruluk

Güven Skoru 65-70% - Kapsamlı Doğrulama Akışı

Örnek Senaryo: "5746 sayılı kanuna göre adam-ay hesaplaması nasıl yapılır?" (68% güven skoru)

  1. Orta-Düşük Güven - CoVe Doğrulama

    • 4 aşamalı Chain-of-Verification süreci uygulanır
    • Temel yanıt: İlk LLM yanıtı oluşturulur
    • Doğrulama soruları: Sistematik sorular üretilir
      • "5746 sayılı kanunda adam-ay tanımı nedir?"
      • "Projeye atanan personel sayısı nasıl hesaplanır?"
      • "Ar-Ge projelerinde adam-ay formülü nasıl uygulanır?"
    • Bağımsız doğrulama: Her soru GraphRAG ile ayrı ayrı doğrulanır
    • Rafine yanıt: Doğrulama sonuçlarına göre yanıt iyileştirilir
    • Self-Correction Loop'tan Farkı: Daha kapsamlı ve sistematik, tüm iddia edilen bilgileri tek tek doğrular
  2. Final Yanıt

    • Yüksek doğruluk garantisi ile sunulur
    • Sonuç: Yavaş ama çok güvenilir yanıt

Güven Skoru <65% - Sistem İyileştirme Akışı

Örnek Senaryo: Karmaşık çoklu ilişki analizi (45% güven skoru)

  1. Çok Düşük Güven - Human-in-the-Loop Calibration

    • Sistem tüm süreci detaylıca loglar
    • Geliştiriciler workflow'u analiz eder ve iyileştirir
    • GraphRAG ilişkilerini zenginleştirme, SQL sorgularını geliştirme
  2. Geçici Yanıt

    • Kullanıcıya "Bu sorgu için daha fazla veri gerekiyor" bilgisi verilir
    • Sonuç: Sistem öğrenmesi ve sürekli iyileşme

Geliştirme Aşamasında Denenecek Doğrulama Yöntemleri

Cross-Model Validation: GPT-5.1, Claude 4.5 Opus, Gemini 3.5 gibi en güncel modellerin yanıtlarını karşılaştırarak en güvenilir ve tutarlı sonucu seçeceğiz.

Human-in-the-Loop Calibration: Çok düşük güven skorlarında (<65%) sistem tüm süreci detaylıca loglar ve geliştiricilerin workflow'u iyileştirmesini sağlar. Loglanan veriler arasında sorgu, yanıt, kullanılan araçlar, güven skorları ve tüm ara adımlar bulunur. Geliştiriciler bu verileri analiz ederek GraphRAG ilişkilerini zenginleştirme, SQL sorgu kalıplarını iyileştirme veya kural motoru mantığını geliştirme gibi sistem iyileştirmeleri yapar.

Model Yapılandırması ve Döngü Yönetimi

Temperature Ayarı: Tutarlı ve denetlenebilir yanıtlar için modellerde temperature = 0 kullanacağız. Bu yaklaşım aynı girdiye her zaman aynı çıktıyı garanti eder.

Döngü Önleme Teknikleri:

  • Maksimum İterasyon Sınırı: Agent döngülerinin 10 adımdan fazla sürmemesi için sınırlandırma
  • Döngü Tespiti: Tekrarlayan yanıtların otomatik algılanması ve durdurulması
  • Fallback Mekanizması: Döngü durumunda geçici olarak nucleus sampling (top-p = 0.9) ile yeniden deneme
  • İnsan Müdahalesi: Kritik durumlarda uzman kontrolü için human-in-the-loop mekanizması

Performans Metrikleri

  • Halüsinasyon Azaltma: %35-90 (CoVe ile)
  • Multi-Agent Consensus: %30 hata azaltma
  • Self-Correction: %28 başarı artışı
  • Answer Confidence: %45 hata tespit artışı

Geliştirme Aşamasında Denenecek Doğrulama Yöntemleri

Cross-Model Validation: GPT-5.1, Claude 4.5 Opus, Gemini 3.5 gibi en güncel modellerin yanıtlarını karşılaştırarak en güvenilir ve tutarlı sonucu seçeceğiz.

Human-in-the-Loop Calibration: Çok düşük güven skorlarında (<65%) sistem tüm süreci detaylıca loglar ve geliştiricilerin workflow'u iyileştirmesini sağlar. Loglanan veriler arasında sorgu, yanıt, kullanılan araçlar, güven skorları ve tüm ara adımlar bulunur. Geliştiriciler bu verileri analiz ederek GraphRAG ilişkilerini zenginleştirme, SQL sorgu kalıplarını iyileştirme veya kural motoru mantığını geliştirme gibi sistem iyileştirmeleri yapar.

Model Yapılandırması ve Döngü Yönetimi

Temperature Ayarı: Tutarlı ve denetlenebilir yanıtlar için modellerde temperature = 0 kullanacağız. Bu yaklaşım aynı girdiye her zaman aynı çıktıyı garanti eder.

Döngü Önleme Teknikleri:

  • Maksimum İterasyon Sınırı: Agent döngülerinin 10 adımdan fazla sürmemesi için sınırlandırma
  • Döngü Tespiti: Tekrarlayan yanıtların otomatik algılanması ve durdurulması
  • Fallback Mekanizması: Döngü durumunda geçici olarak nucleus sampling (top-p = 0.9) ile yeniden deneme
  • İnsan Müdahalesi: Kritik durumlarda uzman kontrolü için human-in-the-loop mekanizması

Performans Metrikleri

  • Halüsinasyon Azaltma: %35-90 (CoVe ile)
  • Multi-Agent Consensus: %30 hata azaltma
  • Self-Correction: %28 başarı artışı
  • Answer Confidence: %45 hata tespit artışı

Human-in-the-Loop Calibration: Çok düşük güven skorlarında (<65%) sistem tüm süreci detaylıca loglar ve geliştiricilerin workflow'u iyileştirmesini sağlar. Loglanan veriler arasında sorgu, yanıt, kullanılan araçlar, güven skorları ve tüm ara adımlar bulunur. Geliştiriciler bu verileri analiz ederek GraphRAG ilişkilerini zenginleştirme, SQL sorgu kalıplarını iyileştirme veya kural motoru mantığını geliştirme gibi sistem iyileştirmeleri yapar.

Teknik Detaylar: Chain-of-Verification (CoVe)

Yanlış ama güvenilir gibi görünen bilgi üretme riskini azaltır. LLM'nin kendi ürettiği yanıtları kendisi doğrulamasını sağlar.

4 Aşamalı Doğrulama Süreci

  1. Temel Yanıt Üretimi: LLM ilk yanıtı üretir
  2. Doğrulama Soruları Planlama: Anahtar iddiaları doğrulamak için sorular
  3. Bağımsız Doğrulama: Sorular bağımsız olarak yanıtlanır
  4. Doğrulanmış Son Yanıt: Doğrulama sonuçlarına dayalı rafine yanıt

Performans Metrikleri:

  • Liste içeren sorularda: %10-30 precision artışı
  • Model parametrelerine dayanan cevaplar için F1 skorunda %23 artış (0.39 → 0.48)

Teknik Detaylar: Güvenlik ve Erişim Kontrolü

Katmanlı Güvenlik Mimarisi

Row Level Security (RLS):

  • PostgreSQL politikaları ile veri seviyesinde güvenlik
  • Kullanıcı rolü bazında erişim kontrolü
  • Yetkisiz erişimi engelleme
-- PostgreSQL'de RLS politikası örneği
CREATE POLICY user_data_policy ON personel
    FOR ALL TO app_user
    USING (
        firma_id = current_setting('app.current_firma_id')::int 
        AND current_setting('app.user_role') IN ('admin', 'muhasebeci', 'insan_kaynaklari')
    );

-- Bu politika şu anlama gelir:
-- Kullanıcı sadece kendi firmasının verilerini görebilir
-- Ve sadece yetkili roller (admin, muhasebeci, insan_kaynaklari) erişebilir
-- Prompt injection ile bu politika aşılamaz

Whitelisted SQL View / Fonksiyonları:

  • Önceden tanımlanmış güvenli SQL View ve işlemleri
  • Teşvik hesaplamaları için özel ve güvenilir matematiksel fonksiyonlar
  • PII verilerinin RBAC kontrolü ile maskelenmesi
-- Kullanıcı: "Personel listesini göster"
-- TAG tarafından oluşturulan SQL:
SELECT 
    ad,        -- Kullanici rolu İK degilse "***MASKED***" döner
    soyad,     -- Kullanici rolu İK degilse "***MASKED***" döner
    maas,      -- Kullanici rolu İK degilse NULL döner
    sgk_tesviki, 
FROM personel_secure;

Teknik Detaylar: Kural Motoru Mimarisi

Deterministik Hesaplama Sistemi

Pure Function Prensipleri:

  • Yan etki olmayan saf fonksiyonlar
  • Girdi-çıktı determinizmi
  • ReturnContext yapısı ile standartlaştırma

Bağımlılık Yönetimi:

  • Bağımlılık grafiği algoritması
  • Otomatik yeniden değerlendirme
  • Veri değişikliklerinde kural tetikleme

Loglama ve İzlenebilirlik:

  • Timestamp, girdi parametreleri, çıktı sonucu
  • Hesaplama adımlarının detaylı kaydı
  • "Nasıl hesaplandı" sorgularına yanıt

BoundaryML Entegrasyonu:

  • LLM'nin harici fonksiyonları çağırması
  • JSON formatında veri alışverişi
  • Server-side fonksiyon yürütümü

BoundaryML İş Akışı

1. Fonksiyon Tanımlama (BAML):

// BAML içinde fonksiyon tanımı
function sgkTeşvikHesapla(
  maas: number,
  arGePersoneli: boolean,
  kanunMaddesi: string
) -> {
  teşvikTutari: number,
  hesaplamaDetayi: string,
  kanunReferansi: string
}

2. TAG'dan Veri Çekme:

-- TAG katmanından gerekli veriler
SELECT maas, ar_ge_personeli, '3' as kanun_maddesi 
FROM personel_secure 
WHERE id = 123

3. LLM Fonksiyon Çağrısı:

{
  "function": "sgkTeşvikHesapla",
  "parameters": {
    "maas": 15000,
    "arGePersoneli": true,
    "kanunMaddesi": "3"
  }
}

4. Server-side Yürütüm:

// Server'da pure function çalıştırma
const sonuc = await sgkTeşvikHesapla(15000, true, "3");
// { teşvikTutari: 7500, hesaplamaDetayi: "15000 TL × %50 = 7500 TL", ... }

5. LLM'e Sonuç Döndürme:

{
  "teşvikTutari": 7500,
  "hesaplamaDetayi": "15000 TL × %50 = 7500 TL",
  "kanunReferansi": "5746 sayılı kanunun 3. maddesi"
}

Pratik Örnek

Kullanıcı Sorusu: "15,000 TL maaşlı Ar-Ge personelim için SGK teşviki ne kadar?"

Süreç:

  1. TAG: Personel verilerini PostgreSQL'den çeker
  2. LLM: Gerekli parametreleri belirler ve fonksiyon çağrısı yapar
  3. BAML: JSON formatında parametreleri hazırlar
  4. Server: Pure function'ı yürütür (deterministik hesaplama)
  5. LLM: Sonucu alır ve kullanıcıya doğal dilde açıklar

Final Yanıt: "Ar-Ge personeliniz için SGK teşviki 7,500 TL'dir. Hesaplama: 15,000 TL × %50 = 7,500 TL Kanun Referansı: 5746 sayılı kanunun 3. maddesi"

Beklenen Faydalar

Operasyonel İyileştirmeler

  • ✅ Teşvik kayıplarının minimize edilmesi
  • ✅ Denetim süreçlerinde izlenebilirliğin artırılması
  • ✅ Firmaların operasyonel verimliliğinin yükseltilmesi
  • ✅ LLM Chatbot ile kullanıcı deneyiminin artırılması

Yenilikçi Yönler

  • Türkçe RegTech Kural Motoru: 150+ parametrik kural, gerçek zamanlı denetim (< 500 ms), LLM ile kural/şema anlayışı.
  • Mevzuat Tabanlı Kurallar: SGK günleri 0–31, Ar-Ge günleri ≤ SGK, adam-ay 0–1, STB zorunluluğu, GV/DV terkinleri kurum tipine göre.
  • Hibrit Veri Erişim: PostgreSQL (kurumsal veriler) + Neo4j/GraphRAG (mevzuat ilişkileri), veri çelişkisi tespiti ve otomatik çözüm.
  • LLM Danışman: Türkçe doğal dil, çoklu atlama, bağlamsal açıklamalar, kaynak gösterimi ve açıklanabilirlik.

Kişiselleştirilmiş Mevzuat Anlayışı

Kullanıcı Bağlamı ile Öğrenme

  • Kişisel Veri Seti: Kullanıcının kendi proje/personel verileri üzerinden öğrenme
  • Bağlamsal Sorular: "Bu personelim için SGK teşviki nasıl hesaplanır?"
  • Problem Odaklı Analiz: Kullanıcının spesifik durumuna göre mevzuat açıklaması
  • Pratik Senaryolar: Gerçek verilerle mevzuat kurallarının uygulanması

Ekonomik ve Ulusal Kazanımlar

  • Teşviklerin doğru ve sürdürülebilir kullanımı ile cezai risklerin azalması.
  • Operasyonel süreçlerin hızlanması ve zaman/maliyet tasarrufu.
  • Denetim süreçlerinde şeffaflık ve izlenebilirlik.
  • Kamu kaynaklarının daha verimli kullanımı ve ulusal düzeyde verimlilik artışı.
  • Nitelikli iş gücünün daha etkin kullanımı ve bilgi tabanlı ekonomiye katkı.

Somut Hedefler ve Metrikler (Özet)

Ölçüt Hedef
Kural Motoru Başarı Oranı ≥ %99 (FPR ≤ %1, FNR ≤ %1)
Kural Motoru Yanıt Süresi < 500 ms
RAG Performansı (P@5 / R@20 / nDCG@10) ≥ 0.65 / ≥ 0.75 / ≥ 0.7
Kullanıcı Zaman Tasarrufu ≥ %60
Sistem Uptime ≥ %99.5
KVKK ve Güvenlik OWASP LLM Top‑10, MITRE ATLAS uyumlu

Detaylı Performans Metrikleri

LLM Doğruluk Kriterleri

  • Faithfulness: ≥ 0.9 (yanıtların kaynaklara uygunluğu)
  • Answer Relevancy: ≥ 0.9 (yanıtların soruya uygunluğu)
  • Citation Accuracy: ≥ 0.9 (kaynak gösteriminin doğruluğu)

CoVe ve Doğrulama Performansı

  • Halüsinasyon Azaltma: %35-90 (CoVe tekniği ile)
  • GraphRAG Doğruluk Artışı: %35-90 (geleneksel RAG'e göre)
  • Multi-Agent Consensus: %30 hata azaltma
  • Answer Confidence: %45 hata tespit artışı
  • Self-Correction: %28 başarı artışı

Entegrasyon ve Güvenlik

  • Entegrasyon Kapsamı: ≥ 5 muhasebe yazılımı ile çift yönlü API
  • Veri Güvenliği: OWASP LLM Top-10, MITRE ATLAS uyumlu
  • KVKK Uyumluluğu: %100

Yol Haritası (Modüller)

  • Modül 1: Veri Toplama ve Hazırlık — Ekim 2025 – Mart 2026 (6 ay)
  • Modül 2: Kural Motoru Geliştirme — Ocak 2026 – Haziran 2026 (6 ay)
  • Modül 3: Hibrit Veri Erişim Sistemi — Mart 2026 – Ağustos 2026 (6 ay)
  • Modül 4: Yapay Zekâ ve Doğrulama — Haziran 2026 – Kasım 2026 (6 ay)
  • Modül 5: Test, Entegrasyon ve Optimizasyon — Eylül 2026 – Mart 2027 (7 ay)

İş Paketleri (Özet)

  • WP001: Hibrit veritabanı şeması, ≥150 kural kütüphanesi, UI prototipi.
  • WP002: Kural motoru, bağımlılık yönetimi, loglama, BoundaryML katmanı.
  • WP003: TAG, Whitelisted SQL, RLS/RBAC, GraphRAG katmanı.
  • WP004: AI Agent, Golden Test Set, CoVe, Multi‑Agent Consensus.
  • WP005: Entegrasyon testleri, performans optimizasyonu, güvenlik ve dağıtım.

Teknik Zorluklar ve Çözümler

1. LLM Halüsinasyon ve Doğruluk Problemleri

Zorluk: LLM'lerin güvenilir ama yanlış bilgi üretme riski Çözüm:

  • 6 aşamalı doğrulama sistemi ile %35-90 hata azaltma
  • Multi-Model Consensus ile %30 hata azaltma
  • Self-Correction Loop ile %28 başarı artışı
  • Güven skoruna göre otomatik karar verme (>%90 direkt teslim)

2. Mevzuat Değişikliklerine Hızlı Adaptasyon

Zorluk: Türk teşvik mevzuatının sürekli değişen yapısı Çözüm:

  • Mevzuat versiyonlama sistemi
  • Otomatik güncelleme mekanizmaları
  • SGK/GİB arayüz değişikliklerini takip eden monitoring
  • Hızlı patch mekanizmaları ve geçici eski kural koruması

3. Veri Güvenliği ve KVKK Uyumluluğu

Zorluk: Kurumsal finansal verilerin güvenli işlenmesi Çözüm:

  • İstemci taraflı şifreleme ve veri anonimleştirme
  • Row Level Security (RLS) ve RBAC ile erişim kontrolü
  • Veri seviyesinde güvenlik politikaları

4. Performans ve Ölçeklenebilirlik

Zorluk: Büyük veri hacimlerinde düşük gecikme süresi Çözüm:

  • <500 ms kural motoru yanıt süresi
  • <1 saniye hesaplama süresi
  • Önbellekleme stratejileri ve yatay ölçekleme
  • Performans optimizasyonu ve maliyet kontrolü

5. Çok-Ajanlı Sistem Hataya Dayanıklılığı

Zorluk: Çoklu agent'ların orkestrasyonunda hata yönetimi Çözüm:

  • Circuit breaker pattern'leri ve retry mekanizmaları
  • Fallback mekanizmaları ile tek agent sistemlere geçiş
  • Sürekli monitoring ve logging sistemi
  • Manuel müdahale protokolleri

Riskler ve Önlemler

  • LLM halüsinasyon/doğruluk: 6 aşamalı doğrulama sistemi, Multi-Model Consensus, güven skoruna göre otomatik karar verme.
  • Mevzuat değişimi/adaptasyon: Mevzuat versiyonlama ve otomatik güncelleme; hızlı patch ve geçici eski kural koruması.
  • Veri güvenliği/KVKK: Anonimleştirme, RLS/RBAC
  • Performans/ölçeklenebilirlik: <500 ms kural, <1 sn hesaplama; önbellekleme ve yatay ölçek.
  • Çok‑ajanlı orkestrasyon: Circuit breaker, retry, fallback tek‑ajan; sürekli izleme ve loglama.

Karmaşık Sorgu Örnekleri ve Kullanılan Teknikler

Basit Veri Sorguları (TAG - Table Augmented Generation)

Sorgu: "Geçen ay toplam SGK teşviki ne kadar oldu?"

  • Teknik: PostgreSQL'den veri çekme + LLM ile doğal dil yanıtı
  • İşlem: Kullanıcı verilerini güvenli SQL ile sorgula, sonucu hesapla
  • Güven Skoru: Yüksek (>%95) - Doğrudan veritabanından gelen sayısal veri

Karmaşık İlişki Analizi (GraphRAG)

Sorgu: "Ar-Ge personeli maaşı nasıl hesaplanır ve hangi teşviklerden faydalanır?"

  • Teknik: Neo4j grafik veritabanından çoklu ilişki analizi
  • İşlem: Personel → Proje → Teşvik kuralları arasındaki bağlantıları tara
  • Güven Skoru: Yüksek (>%90) - Mevzuat ilişkilerini grafik üzerinden doğrula

Çok Adımlı Doğrulama Gerektiren Sorgular (CoVe)

Sorgu: "5746 sayılı kanuna göre adam-ay hesaplaması nasıl yapılır?"

  • Teknik: CoVe (Chain-of-Verification) ile adım adım doğrulama
  • İşlem: Araç sonuçlarından yanıt üret → Doğrulama soruları oluştur → Bağımsız kaynaklarla kontrol et → Rafine yanıt üret
  • Güven Skoru: Orta-Yüksek (%70-90) - CoVe ile %35-90 halüsinasyon azaltma

Gerçek Zamanlı Hesaplama ve Doğrulama

Sorgu: "Bu çalışanın bordrosuna göre SGK teşvik matrahı ne olacak?"

  • Teknik: Kural motoru + BoundaryML fonksiyon çağrısı
  • İşlem: Verileri topla → Hesaplama fonksiyonunu çalıştır → Sonucu doğrula
  • Güven Skoru: Yüksek (>%95) - Deterministik kural motoru ile hesaplama

Çoklu Veri Kaynağı Entegrasyonu

Sorgu: "Teknopark firmasında bir projeye fatura keserken nelere dikkat etmeliyim?"

  • Teknik: TAG + GraphRAG + CoVe kombinasyonu
  • İşlem: Proje verilerini çek → Mevzuat ilişkilerini analiz et → KDV/GV kurallarını doğrula
  • Güven Skoru: Orta (%60-80) - Çoklu kaynak entegrasyonu nedeniyle kapsamlı doğrulama

deck

By nostrize

deck

  • 7