Ar-Ge Teşvikleri Yönetim Sistemi

Proje Sunumu

Triton Mühendislik

Konum: Bolu Teknokent bünyesinde faaliyet gösteren teknoloji firması
Uzmanlık Alanları:
- Yazılım geliştirme
- Danışmanlık hizmetleri
- Devlet destekleri ve finansal danışmanlık
- Özgün yazılım çözümleri geliştirme

Mevcut Durum Analizi

Ar-Ge Merkezleri, Tasarım Merkezleri ve Teknopark Firmaları

5746 ve 4691 sayılı kanunlar kapsamındaki teşvik süreçleri
Manuel yöntemler veya Excel tabanlı sistemler ile yürütülmekte
Kritik hesaplamalarda hata ve iptal riski yüksek

Kritik Hesaplama Alanları

Adam-ay hesaplamaları
Ar-Ge günü hesaplamaları
SGK teşvik matrahı
Gelir ve damga vergisi terkinleri
Proje-personel eşleştirmeleri
Fatura-Sanayi ve Teknoloji Bakanlığı doğrulamaları

Kullanıcı Deneyimi Sorunları

Karmaşık Mevzuat: 5746/4691/5510 sayılı kanunların karmaşıklığı
Sürekli Değişim: Yönetmelik ve tebliğlerdeki güncellemeler
Teknik Dil: Hukuki terimlerin anlaşılması zorluğu
Bağlam Eksikliği: Kuralların pratik uygulamalarının belirsizliği

Kural Motoru Avantajları

Operasyonel Faydalar

✅ Mevzuat Uyumu: Yeni girilen veya güncellenen verilerin ilgili olduğu kuralların otomatik olarak çalıştırılıp denetlenmesi; böylece tüm süreçlerde mevzuata uygunluk, sürekli ve kesintisiz bir şekilde sağlanır
✅ Hata Minimizasyonu: ≥ %99 tespit hassasiyeti
✅ Güncellenebilirlik: Parametrik yapı sayesinde kolay adaptasyon

LLM Asistan Çözümü

Kendi Kendine Öğrenme Platformu

Doğal Dil Sorguları: "Ar-Ge gününde ücretsiz izin geçerli mi?"
Bağlamsal Yanıtlar: Mevzuat referansları ile açıklamalar
Pratik Örnekler: Gerçek senaryolar üzerinden öğrenme
Sürekli Güncelleme: Yeni mevzuat değişikliklerinin otomatik entegrasyonu

Proje Hedefi

"Ar-Ge Teşvikleri Yönetim Sistemi"

Mevzuata tam uyumlu
Denetlenebilir
Otomatik çalışabilen yazılım platformu
LLM Asistanı ile kullanıcıya özel rehberlik

Projenin Amacı

5746 ve 4691 kapsamındaki teşvik süreçlerini uçtan uca dijitalleştiren, mevzuata tam uyumlu ve denetlenebilir bir platform geliştirmek.
Parametrik kural motoru ile gerçek zamanlı uyum denetimi; SGK ve vergi hesap motorları ile otomatik ve hatasız dağıtımlar sağlamak.
RAG/GraphRAG ve Chain-of-Verification (CoVe) destekli AI danışman ile mevzuata dayalı, açıklanabilir ve kaynak gösterimli yanıtlar üretmek.
Kurumların teşvik kaybını azaltmak, denetimlerde izlenebilirliği artırmak ve operasyonel verimliliği yükseltmek.

Çözüm Yaklaşımı

1. Veri Toplama ve Hazırlık

1.1 Kullanıcı Verileri (PostgreSQL)

Personel bilgileri, maaş verileri, proje atamaları
Bordro kayıtları, izin bilgileri, çalışma süreleri
Finansal veriler ve teşvik hesaplamaları

1.2 Mevzuat Bilgileri (Neo4j)

5746 ve 4691 sayılı kanun metinleri ve yorumları
Mevzuat ilişkileri ve çapraz referanslar
Güncel tebliğ ve yönetmelik bilgileri

1.3 Kurallar

150+ parametrik kural tanımı
Teşvik hesaplama formülleri ve koşulları
İş kuralları ve validasyon kriterleri

1.4 Diğer Bilgiler (ERP Entegrasyonları)

Logo, Mikro, Paraşüt sistemleriyle çift yönlü API bağlantıları
Harici veri kaynakları ve üçüncü parti servisler
Sistem entegrasyonları ve veri senkronizasyonu

Çözüm Yaklaşımı (Devam)

2. Kural Motoru Kodlama

Saf Fonksiyonlar: Yan etki olmayan deterministik kurallar
Bağımlılık Yönetimi: Otomatik yeniden hesaplama
Loglama ve İzlenebilirlik: Tam şeffaflık için detaylı kayıt
BoundaryML Entegrasyonu: LLM'nin fonksiyon ve şema anlayışını mümkün hale getirme

Çözüm Yaklaşımı (Devam)

3. Hibrit AI Veri Erişim Sistemi

Table-Augmented Generation: Prisma ORM şemaları ile SQL dönüşümü
Whitelisted SQL: Güvenli SQL işlemleri
Row Level Security: RBAC ile veri güvenliği
GraphRAG + Neo4j: Mevzuat ilişkileri ve çoklu atlama

Çözüm Yaklaşımı (Devam)

4. LLM Test ve Doğrulama

Entegre AI Agent: Gerçek senaryolar ile test
Golden Test Set: Benchmark oluşturma
Chain-of-Verification: %35-90 hata azaltma
Multi-Agent Consensus: Güvenilirlik artırma

Teknik Detaylar: Hibrit Veri Mimarisi

Table-Augmented Generation (TAG)

Kullanıcı verilerini PostgreSQL'den çeker ve LLM'ye verir.

Sorgu Sentezi: Doğal dil → SQL dönüşümü (Prisma ORM şemaları yardımıyla)
Sorgu Yürütme: PostgreSQL'de işlem yapma
Veri Birleştirme: Çoklu sorgu / tablo birleştirmeleri
Doğal Dil Üretimi: İnsan okunabilir yanıtlar

Avantajlar: %35-90 halüsinasyon azaltma, gerçek zamanlı veri erişimi, sayısal doğruluk, veri analizi, PostgreSQL RBAC ve Row Level Security ile veri güvenliği sağlanır.

Teknik Detaylar: GraphRAG Sistemi

Neo4j Grafik Veritabanı

İndeksleme Fazı

Metin segmentasyonu (cümle/paragraf bazında)
Varlık/ilişki çıkarımı (LLM ile)
Grafik oluşturma (düğümler + kenarlar)
Topluluk kümeleme (Leiden algoritması)
Özetleme (her topluluk için)

Sorgu Fazı

Global Arama: Geniş kapsamlı sorular için tüm bilgi ağını tarar

Örnek: "Ar-Ge teşvikleri hakkında genel bilgi ver"
Kullanım: Kapsamlı özetler ve trend analizleri için

Yerel Arama: Spesifik varlıkların detaylarına odaklanır

Örnek: "5746 sayılı kanunun 3. maddesi ne diyor?"
Kullanım: Kesin bilgiler ve spesifik kanun maddeleri için

DRIFT Arama: Yerel sonuçları ilgili bağlamla zenginleştirir

Örnek: "SGK teşvik hesabı nasıl yapılır?" (teşvik + ilgili kanunlar + uygulama örnekleri)
Kullanım: Bağlamsal yanıtlar ve ilişkili bilgiler için

Performans Kazanımları:

%35-90 doğruluk artışı (geleneksel RAG'e göre)
%25 daha yüksek başarı oranı
Bağlamsal zenginlik sayesinde daha kapsamlı yanıtlar

Performans: %35-90 doğruluk artışı, %25 daha yüksek başarı oranı

Örnek Sorgu

"Ar-Ge personelim için SGK teşviki nasıl hesaplanır?"

Kontekst Belirleme: Sorgudaki "Ar-Ge personeli" ifadesinden kurum tipini (Ar-Ge Merkezi) ve ilgili kanunu (5746 sayılı kanun) tespit eder
Yerel Arama: Bağlama uygun "Ar-Ge personeli" ve "SGK teşviki (5746)" düğümlerini bulur - yanlış kontekstteki (4691 sayılı kanun) düğümleri hariç tutar
İlişki Analizi: Ar-Ge personeli ile 5746 kapsamındaki SGK teşvik kuralları arasındaki spesifik bağlantıları inceler
Global/Topluluk Bağlamı: "5746 SGK Teşvikleri" kümesinden ek bilgi alır, diğer kanunların teşviklerini (4691) hariç tutar
Çoklu Atlama: Doğru kanun maddelerine (5746/3), hesaplama formüllerine ve Ar-Ge spesifik şartlara atlar
Birleştirme: Bağlama uygun tüm bilgileri birleştirerek kapsamlı yanıt üretir

Bu sistem sayesinde kullanıcı sadece "SGK teşviki" genel bilgisi değil, aynı zamanda kurum tipine özel "nasıl hesaplandığı", "hangi kanun maddesine dayandığı" ve "Ar-Ge şartlarına uygunluğu" gibi bağlamsal bilgileri alır.

Teknik Detaylar: AI Agent İş Akışı ve Doğrulama Sistemi

Farklı Sorgu Karmaşıklıklarına Göre Doğrulama Stratejileri

Sorgu Tipi	Karmaşıklık	Veri Kaynağı	Doğrulama Yöntemi	Hedef Güven Skoru	Örnek
Basit Veri Sorgu	Düşük	PostgreSQL	Direkt Doğrulama	>%95	"Geçen ay toplam teşvik?"
Teknik Hesaplama	Orta	Kural Motoru	CoVe + Self-Correction	>%90	"SGK matrah hesabı?"
Mevzuat Açıklaması	Yüksek	GraphRAG	CoVe + Multi-Model	>%85	"Kanun maddesi yorumu?"
Çoklu İlişki	Çok Yüksek	Hibrit Sistem	Tüm Yöntemler	>%80	"Firma stratejisi analizi?"

Gerçek Dünyada AI Agent Örneği

Kullanıcı Sorusu: "Ar-Ge merkezinde çalışan Ahmet'in maaşı için ne kadar SGK teşviki alabilirim?"

AI Agent İş Akışı:

Araç Seçimi ve Planlama
- LLM sorguyu analiz eder ve gerekli araçları belirler
- TAG, GraphRAG ve Kural Motoru araçlarını seçer
Araç Yürütümü
- TAG ile PostgreSQL'den Ahmet'in bordro verilerini çek
- GraphRAG ile 5746 sayılı kanun SGK teşvik kurallarını tara
- Kural motorunu çağırarak teşvik hesaplama formüllerini (nasıl hesaplandı bilgisi) ve sonucu al (Tool Calling)
Veri İşleme ve Yanıt Üretimi
- Araç sonuçlarını birleştirerek LLM ile doğal dil yanıtı üret
Güven Skoru Hesaplama
- Bir veya birden fazla yöntem kullanılabilir
- Multi-Model Consensus: GPT-4, Claude 3 ile karşılaştır (85% benzerlik)
- Semantic Entropy: Çoklu yanıt üretiminde anlamsal tutarlılığı ölçer (farklı kelimelerle aynı anlam = düşük entropi = yüksek güven)
- Final Güven Skoru: Skora göre farklı akışlar uygulanır

Güven Skoru >90% - Direkt Teslim Akışı

Örnek Senaryo: "Geçen ay toplam SGK teşviki ne kadar oldu?"

Yüksek Güven - Direkt Yanıt
- Güven skoru >90% olduğu için doğrulama gerekli değil
- Kullanıcıya doğrudan yanıt verilir
- Sonuç: Hızlı ve güvenilir yanıt

Güven Skoru 70-90% - Hafif Doğrulama Akışı

Örnek Senaryo: "Ar-Ge merkezinde çalışan Ahmet'in maaşı için ne kadar SGK teşviki alabilirim?" (82% güven skoru)

Orta-Yüksek Güven - Self-Correction Loop
- Hafif düzeyde doğrulama uygulanır
- Doğrulama soruları oluştur: "5746 sayılı kanunda SGK teşvik oranı ne?"
- GraphRAG ile soruları bağımsız olarak yanıtla
- Orijinal yanıtı doğrula ve gerekirse rafine et
Final Yanıt
- Kaynak gösterimi ile kullanıcıya sunulur
- Sonuç: Dengeli hız ve doğruluk

Güven Skoru 65-70% - Kapsamlı Doğrulama Akışı

Örnek Senaryo: "5746 sayılı kanuna göre adam-ay hesaplaması nasıl yapılır?" (68% güven skoru)

Orta-Düşük Güven - CoVe Doğrulama
- 4 aşamalı Chain-of-Verification süreci uygulanır
- Temel yanıt: İlk LLM yanıtı oluşturulur
- Doğrulama soruları: Sistematik sorular üretilir
  - "5746 sayılı kanunda adam-ay tanımı nedir?"
  - "Projeye atanan personel sayısı nasıl hesaplanır?"
  - "Ar-Ge projelerinde adam-ay formülü nasıl uygulanır?"
- Bağımsız doğrulama: Her soru GraphRAG ile ayrı ayrı doğrulanır
- Rafine yanıt: Doğrulama sonuçlarına göre yanıt iyileştirilir
- Self-Correction Loop'tan Farkı: Daha kapsamlı ve sistematik, tüm iddia edilen bilgileri tek tek doğrular
Final Yanıt
- Yüksek doğruluk garantisi ile sunulur
- Sonuç: Yavaş ama çok güvenilir yanıt

Güven Skoru <65% - Sistem İyileştirme Akışı

Örnek Senaryo: Karmaşık çoklu ilişki analizi (45% güven skoru)

Çok Düşük Güven - Human-in-the-Loop Calibration
- Sistem tüm süreci detaylıca loglar
- Geliştiriciler workflow'u analiz eder ve iyileştirir
- GraphRAG ilişkilerini zenginleştirme, SQL sorgularını geliştirme
Geçici Yanıt
- Kullanıcıya "Bu sorgu için daha fazla veri gerekiyor" bilgisi verilir
- Sonuç: Sistem öğrenmesi ve sürekli iyileşme

Geliştirme Aşamasında Denenecek Doğrulama Yöntemleri

Cross-Model Validation: GPT-5.1, Claude 4.5 Opus, Gemini 3.5 gibi en güncel modellerin yanıtlarını karşılaştırarak en güvenilir ve tutarlı sonucu seçeceğiz.

Human-in-the-Loop Calibration: Çok düşük güven skorlarında (<65%) sistem tüm süreci detaylıca loglar ve geliştiricilerin workflow'u iyileştirmesini sağlar. Loglanan veriler arasında sorgu, yanıt, kullanılan araçlar, güven skorları ve tüm ara adımlar bulunur. Geliştiriciler bu verileri analiz ederek GraphRAG ilişkilerini zenginleştirme, SQL sorgu kalıplarını iyileştirme veya kural motoru mantığını geliştirme gibi sistem iyileştirmeleri yapar.

Model Yapılandırması ve Döngü Yönetimi

Temperature Ayarı: Tutarlı ve denetlenebilir yanıtlar için modellerde temperature = 0 kullanacağız. Bu yaklaşım aynı girdiye her zaman aynı çıktıyı garanti eder.

Döngü Önleme Teknikleri:

Maksimum İterasyon Sınırı: Agent döngülerinin 10 adımdan fazla sürmemesi için sınırlandırma
Döngü Tespiti: Tekrarlayan yanıtların otomatik algılanması ve durdurulması
Fallback Mekanizması: Döngü durumunda geçici olarak nucleus sampling (top-p = 0.9) ile yeniden deneme
İnsan Müdahalesi: Kritik durumlarda uzman kontrolü için human-in-the-loop mekanizması

Performans Metrikleri

Halüsinasyon Azaltma: %35-90 (CoVe ile)
Multi-Agent Consensus: %30 hata azaltma
Self-Correction: %28 başarı artışı
Answer Confidence: %45 hata tespit artışı

Geliştirme Aşamasında Denenecek Doğrulama Yöntemleri

Cross-Model Validation: GPT-5.1, Claude 4.5 Opus, Gemini 3.5 gibi en güncel modellerin yanıtlarını karşılaştırarak en güvenilir ve tutarlı sonucu seçeceğiz.

Model Yapılandırması ve Döngü Yönetimi

Temperature Ayarı: Tutarlı ve denetlenebilir yanıtlar için modellerde temperature = 0 kullanacağız. Bu yaklaşım aynı girdiye her zaman aynı çıktıyı garanti eder.

Döngü Önleme Teknikleri:

Maksimum İterasyon Sınırı: Agent döngülerinin 10 adımdan fazla sürmemesi için sınırlandırma
Döngü Tespiti: Tekrarlayan yanıtların otomatik algılanması ve durdurulması
Fallback Mekanizması: Döngü durumunda geçici olarak nucleus sampling (top-p = 0.9) ile yeniden deneme
İnsan Müdahalesi: Kritik durumlarda uzman kontrolü için human-in-the-loop mekanizması

Performans Metrikleri

Halüsinasyon Azaltma: %35-90 (CoVe ile)
Multi-Agent Consensus: %30 hata azaltma
Self-Correction: %28 başarı artışı
Answer Confidence: %45 hata tespit artışı

Teknik Detaylar: Chain-of-Verification (CoVe)

Yanlış ama güvenilir gibi görünen bilgi üretme riskini azaltır. LLM'nin kendi ürettiği yanıtları kendisi doğrulamasını sağlar.

4 Aşamalı Doğrulama Süreci

Temel Yanıt Üretimi: LLM ilk yanıtı üretir
Doğrulama Soruları Planlama: Anahtar iddiaları doğrulamak için sorular
Bağımsız Doğrulama: Sorular bağımsız olarak yanıtlanır
Doğrulanmış Son Yanıt: Doğrulama sonuçlarına dayalı rafine yanıt

Performans Metrikleri:

Liste içeren sorularda: %10-30 precision artışı
Model parametrelerine dayanan cevaplar için F1 skorunda %23 artış (0.39 → 0.48)

Teknik Detaylar: Güvenlik ve Erişim Kontrolü

Katmanlı Güvenlik Mimarisi

Row Level Security (RLS):

PostgreSQL politikaları ile veri seviyesinde güvenlik
Kullanıcı rolü bazında erişim kontrolü
Yetkisiz erişimi engelleme

-- PostgreSQL'de RLS politikası örneği
CREATE POLICY user_data_policy ON personel
    FOR ALL TO app_user
    USING (
        firma_id = current_setting('app.current_firma_id')::int 
        AND current_setting('app.user_role') IN ('admin', 'muhasebeci', 'insan_kaynaklari')
    );

-- Bu politika şu anlama gelir:
-- Kullanıcı sadece kendi firmasının verilerini görebilir
-- Ve sadece yetkili roller (admin, muhasebeci, insan_kaynaklari) erişebilir
-- Prompt injection ile bu politika aşılamaz

Whitelisted SQL View / Fonksiyonları:

Önceden tanımlanmış güvenli SQL View ve işlemleri
Teşvik hesaplamaları için özel ve güvenilir matematiksel fonksiyonlar
PII verilerinin RBAC kontrolü ile maskelenmesi

-- Kullanıcı: "Personel listesini göster"
-- TAG tarafından oluşturulan SQL:
SELECT 
    ad,        -- Kullanici rolu İK degilse "***MASKED***" döner
    soyad,     -- Kullanici rolu İK degilse "***MASKED***" döner
    maas,      -- Kullanici rolu İK degilse NULL döner
    sgk_tesviki, 
FROM personel_secure;

Teknik Detaylar: Kural Motoru Mimarisi

Deterministik Hesaplama Sistemi

Pure Function Prensipleri:

Yan etki olmayan saf fonksiyonlar
Girdi-çıktı determinizmi
ReturnContext yapısı ile standartlaştırma

Bağımlılık Yönetimi:

Bağımlılık grafiği algoritması
Otomatik yeniden değerlendirme
Veri değişikliklerinde kural tetikleme

Loglama ve İzlenebilirlik:

Timestamp, girdi parametreleri, çıktı sonucu
Hesaplama adımlarının detaylı kaydı
"Nasıl hesaplandı" sorgularına yanıt

BoundaryML Entegrasyonu:

LLM'nin harici fonksiyonları çağırması
JSON formatında veri alışverişi
Server-side fonksiyon yürütümü

BoundaryML İş Akışı

1. Fonksiyon Tanımlama (BAML):

// BAML içinde fonksiyon tanımı
function sgkTeşvikHesapla(
  maas: number,
  arGePersoneli: boolean,
  kanunMaddesi: string
) -> {
  teşvikTutari: number,
  hesaplamaDetayi: string,
  kanunReferansi: string
}

2. TAG'dan Veri Çekme:

-- TAG katmanından gerekli veriler
SELECT maas, ar_ge_personeli, '3' as kanun_maddesi 
FROM personel_secure 
WHERE id = 123

3. LLM Fonksiyon Çağrısı:

{
  "function": "sgkTeşvikHesapla",
  "parameters": {
    "maas": 15000,
    "arGePersoneli": true,
    "kanunMaddesi": "3"
  }
}

4. Server-side Yürütüm:

// Server'da pure function çalıştırma
const sonuc = await sgkTeşvikHesapla(15000, true, "3");
// { teşvikTutari: 7500, hesaplamaDetayi: "15000 TL × %50 = 7500 TL", ... }

5. LLM'e Sonuç Döndürme:

{
  "teşvikTutari": 7500,
  "hesaplamaDetayi": "15000 TL × %50 = 7500 TL",
  "kanunReferansi": "5746 sayılı kanunun 3. maddesi"
}

Pratik Örnek

Kullanıcı Sorusu: "15,000 TL maaşlı Ar-Ge personelim için SGK teşviki ne kadar?"

Süreç:

TAG: Personel verilerini PostgreSQL'den çeker
LLM: Gerekli parametreleri belirler ve fonksiyon çağrısı yapar
BAML: JSON formatında parametreleri hazırlar
Server: Pure function'ı yürütür (deterministik hesaplama)
LLM: Sonucu alır ve kullanıcıya doğal dilde açıklar

Final Yanıt: "Ar-Ge personeliniz için SGK teşviki 7,500 TL'dir. Hesaplama: 15,000 TL × %50 = 7,500 TL Kanun Referansı: 5746 sayılı kanunun 3. maddesi"

Beklenen Faydalar

Operasyonel İyileştirmeler

✅ Teşvik kayıplarının minimize edilmesi
✅ Denetim süreçlerinde izlenebilirliğin artırılması
✅ Firmaların operasyonel verimliliğinin yükseltilmesi
✅ LLM Chatbot ile kullanıcı deneyiminin artırılması

Yenilikçi Yönler

Türkçe RegTech Kural Motoru: 150+ parametrik kural, gerçek zamanlı denetim (< 500 ms), LLM ile kural/şema anlayışı.
Mevzuat Tabanlı Kurallar: SGK günleri 0–31, Ar-Ge günleri ≤ SGK, adam-ay 0–1, STB zorunluluğu, GV/DV terkinleri kurum tipine göre.
Hibrit Veri Erişim: PostgreSQL (kurumsal veriler) + Neo4j/GraphRAG (mevzuat ilişkileri), veri çelişkisi tespiti ve otomatik çözüm.
LLM Danışman: Türkçe doğal dil, çoklu atlama, bağlamsal açıklamalar, kaynak gösterimi ve açıklanabilirlik.

Kişiselleştirilmiş Mevzuat Anlayışı

Kullanıcı Bağlamı ile Öğrenme

Kişisel Veri Seti: Kullanıcının kendi proje/personel verileri üzerinden öğrenme
Bağlamsal Sorular: "Bu personelim için SGK teşviki nasıl hesaplanır?"
Problem Odaklı Analiz: Kullanıcının spesifik durumuna göre mevzuat açıklaması
Pratik Senaryolar: Gerçek verilerle mevzuat kurallarının uygulanması

Ekonomik ve Ulusal Kazanımlar

Teşviklerin doğru ve sürdürülebilir kullanımı ile cezai risklerin azalması.
Operasyonel süreçlerin hızlanması ve zaman/maliyet tasarrufu.
Denetim süreçlerinde şeffaflık ve izlenebilirlik.
Kamu kaynaklarının daha verimli kullanımı ve ulusal düzeyde verimlilik artışı.
Nitelikli iş gücünün daha etkin kullanımı ve bilgi tabanlı ekonomiye katkı.

Somut Hedefler ve Metrikler (Özet)

Ölçüt	Hedef
Kural Motoru Başarı Oranı	≥ %99 (FPR ≤ %1, FNR ≤ %1)
Kural Motoru Yanıt Süresi	< 500 ms
RAG Performansı (P@5 / R@20 / nDCG@10)	≥ 0.65 / ≥ 0.75 / ≥ 0.7
Kullanıcı Zaman Tasarrufu	≥ %60
Sistem Uptime	≥ %99.5
KVKK ve Güvenlik	OWASP LLM Top‑10, MITRE ATLAS uyumlu

Detaylı Performans Metrikleri

LLM Doğruluk Kriterleri

Faithfulness: ≥ 0.9 (yanıtların kaynaklara uygunluğu)
Answer Relevancy: ≥ 0.9 (yanıtların soruya uygunluğu)
Citation Accuracy: ≥ 0.9 (kaynak gösteriminin doğruluğu)

CoVe ve Doğrulama Performansı

Halüsinasyon Azaltma: %35-90 (CoVe tekniği ile)
GraphRAG Doğruluk Artışı: %35-90 (geleneksel RAG'e göre)
Multi-Agent Consensus: %30 hata azaltma
Answer Confidence: %45 hata tespit artışı
Self-Correction: %28 başarı artışı

Entegrasyon ve Güvenlik

Entegrasyon Kapsamı: ≥ 5 muhasebe yazılımı ile çift yönlü API
Veri Güvenliği: OWASP LLM Top-10, MITRE ATLAS uyumlu
KVKK Uyumluluğu: %100

Yol Haritası (Modüller)

Modül 1: Veri Toplama ve Hazırlık — Ekim 2025 – Mart 2026 (6 ay)
Modül 2: Kural Motoru Geliştirme — Ocak 2026 – Haziran 2026 (6 ay)
Modül 3: Hibrit Veri Erişim Sistemi — Mart 2026 – Ağustos 2026 (6 ay)
Modül 4: Yapay Zekâ ve Doğrulama — Haziran 2026 – Kasım 2026 (6 ay)
Modül 5: Test, Entegrasyon ve Optimizasyon — Eylül 2026 – Mart 2027 (7 ay)

İş Paketleri (Özet)

WP001: Hibrit veritabanı şeması, ≥150 kural kütüphanesi, UI prototipi.
WP002: Kural motoru, bağımlılık yönetimi, loglama, BoundaryML katmanı.
WP003: TAG, Whitelisted SQL, RLS/RBAC, GraphRAG katmanı.
WP004: AI Agent, Golden Test Set, CoVe, Multi‑Agent Consensus.
WP005: Entegrasyon testleri, performans optimizasyonu, güvenlik ve dağıtım.

Teknik Zorluklar ve Çözümler

1. LLM Halüsinasyon ve Doğruluk Problemleri

Zorluk: LLM'lerin güvenilir ama yanlış bilgi üretme riski Çözüm:

6 aşamalı doğrulama sistemi ile %35-90 hata azaltma
Multi-Model Consensus ile %30 hata azaltma
Self-Correction Loop ile %28 başarı artışı
Güven skoruna göre otomatik karar verme (>%90 direkt teslim)

2. Mevzuat Değişikliklerine Hızlı Adaptasyon

Zorluk: Türk teşvik mevzuatının sürekli değişen yapısı Çözüm:

Mevzuat versiyonlama sistemi
Otomatik güncelleme mekanizmaları
SGK/GİB arayüz değişikliklerini takip eden monitoring
Hızlı patch mekanizmaları ve geçici eski kural koruması

3. Veri Güvenliği ve KVKK Uyumluluğu

Zorluk: Kurumsal finansal verilerin güvenli işlenmesi Çözüm:

İstemci taraflı şifreleme ve veri anonimleştirme
Row Level Security (RLS) ve RBAC ile erişim kontrolü
Veri seviyesinde güvenlik politikaları

4. Performans ve Ölçeklenebilirlik

Zorluk: Büyük veri hacimlerinde düşük gecikme süresi Çözüm:

<500 ms kural motoru yanıt süresi
<1 saniye hesaplama süresi
Önbellekleme stratejileri ve yatay ölçekleme
Performans optimizasyonu ve maliyet kontrolü

5. Çok-Ajanlı Sistem Hataya Dayanıklılığı

Zorluk: Çoklu agent'ların orkestrasyonunda hata yönetimi Çözüm:

Circuit breaker pattern'leri ve retry mekanizmaları
Fallback mekanizmaları ile tek agent sistemlere geçiş
Sürekli monitoring ve logging sistemi
Manuel müdahale protokolleri

Riskler ve Önlemler

LLM halüsinasyon/doğruluk: 6 aşamalı doğrulama sistemi, Multi-Model Consensus, güven skoruna göre otomatik karar verme.
Mevzuat değişimi/adaptasyon: Mevzuat versiyonlama ve otomatik güncelleme; hızlı patch ve geçici eski kural koruması.
Veri güvenliği/KVKK: Anonimleştirme, RLS/RBAC
Performans/ölçeklenebilirlik: <500 ms kural, <1 sn hesaplama; önbellekleme ve yatay ölçek.
Çok‑ajanlı orkestrasyon: Circuit breaker, retry, fallback tek‑ajan; sürekli izleme ve loglama.

Karmaşık Sorgu Örnekleri ve Kullanılan Teknikler

Basit Veri Sorguları (TAG - Table Augmented Generation)

Sorgu: "Geçen ay toplam SGK teşviki ne kadar oldu?"

Teknik: PostgreSQL'den veri çekme + LLM ile doğal dil yanıtı
İşlem: Kullanıcı verilerini güvenli SQL ile sorgula, sonucu hesapla
Güven Skoru: Yüksek (>%95) - Doğrudan veritabanından gelen sayısal veri

Karmaşık İlişki Analizi (GraphRAG)

Sorgu: "Ar-Ge personeli maaşı nasıl hesaplanır ve hangi teşviklerden faydalanır?"

Teknik: Neo4j grafik veritabanından çoklu ilişki analizi
İşlem: Personel → Proje → Teşvik kuralları arasındaki bağlantıları tara
Güven Skoru: Yüksek (>%90) - Mevzuat ilişkilerini grafik üzerinden doğrula

Çok Adımlı Doğrulama Gerektiren Sorgular (CoVe)

Sorgu: "5746 sayılı kanuna göre adam-ay hesaplaması nasıl yapılır?"

Teknik: CoVe (Chain-of-Verification) ile adım adım doğrulama
İşlem: Araç sonuçlarından yanıt üret → Doğrulama soruları oluştur → Bağımsız kaynaklarla kontrol et → Rafine yanıt üret
Güven Skoru: Orta-Yüksek (%70-90) - CoVe ile %35-90 halüsinasyon azaltma

Gerçek Zamanlı Hesaplama ve Doğrulama

Sorgu: "Bu çalışanın bordrosuna göre SGK teşvik matrahı ne olacak?"

Teknik: Kural motoru + BoundaryML fonksiyon çağrısı
İşlem: Verileri topla → Hesaplama fonksiyonunu çalıştır → Sonucu doğrula
Güven Skoru: Yüksek (>%95) - Deterministik kural motoru ile hesaplama

Çoklu Veri Kaynağı Entegrasyonu

Sorgu: "Teknopark firmasında bir projeye fatura keserken nelere dikkat etmeliyim?"

Teknik: TAG + GraphRAG + CoVe kombinasyonu
İşlem: Proje verilerini çek → Mevzuat ilişkilerini analiz et → KDV/GV kurallarını doğrula
Güven Skoru: Orta (%60-80) - Çoklu kaynak entegrasyonu nedeniyle kapsamlı doğrulama

deck

By nostrize