Bir üretim firmasının IT müdürü geçen ay şunu söyledi: ‘Makine öğrenimi projesi başlatmak istiyoruz, ama hangi verimizin nerede durduğunu bile bilmiyoruz.’ Bu cümle, Türkiye’deki pek çok orta ölçekli şirketin tam ortasında durduğu çelişkiyi özetliyor. Yapay zekâ ve büyük veri, artık yalnızca teknoloji konferanslarının değil, yönetim kurulu toplantılarının da gündeminde. Ancak bu heyecan, çoğu zaman temeli olmayan bir binayı yükseltmeye çalışmak gibi sonuçlanıyor.
Veri stratejisi, bir şirketin hangi verileri hangi amaçla topladığını, bu verileri nasıl sakladığını, kalitesini nasıl güvence altına aldığını ve kimin hangi veriye nasıl erişeceğini tanımlayan yapısal çerçevedir. Yapay zekâ modelleri, bu çerçevenin üzerine inşa edilen son katmandır; temel değil. Bir makine öğrenimi algoritması ne kadar gelişmiş olursa olsun, beslendiği veri kirli, eksik veya tutarsızsa çıktısı da güvenilmez olacaktır. Veri bilimi dünyasında bu durumu tanımlamak için kullanılan ‘çöp girer, çöp çıkar’ ilkesi, AI yatırımlarında da tam anlamıyla geçerlidir.
Peki Türkiye’deki şirketler veri konusunda gerçekte nerede duruyor? e-Fatura ve e-Defter zorunlulukları, işletmelerin dijital veri üretimini ciddi ölçüde artırdı. ERP sistemleri, CRM uygulamaları ve bulut tabanlı araçlar her geçen yıl daha fazla şirkete girdi. Ancak bu araçların varlığı, şirketin bir veri stratejisine sahip olduğu anlamına gelmiyor. Çoğu işletmede finansal veriler ERP’de, müşteri verileri ayrı bir CRM’de, satış ekibinin notları ise Excel tablolarında veya e-posta kutularında dağınık biçimde duruyor. Bu veri adacıkları birbirleriyle konuşmuyor; dolayısıyla üzerlerinde bütünleşik bir analiz yapmak, dolayısıyla anlamlı bir AI uygulaması geliştirmek neredeyse imkânsız.
Veri stratejisinin üç temel bileşeni vardır: envanter, kalite ve erişim mimarisi. Veri envanteri, şirketin elindeki tüm veri kaynaklarını, bu kaynakların formatını, güncellenme sıklığını ve sorumlu birimini belgeleyen bir katalogdur. Kalite programı ise verilerin doğruluğunu, tamlığını ve tutarlılığını düzenli aralıklarla ölçen ve iyileştiren süreçler bütünüdür. Erişim mimarisi, hangi kullanıcının hangi veriye hangi koşullar altında ulaşabileceğini tanımlar; hem operasyonel verimlilik hem de veri güvenliği açısından kritik öneme sahiptir. Bu üç bileşen yerli yerinde olmadan kurulan bir AI altyapısı, kısa sürede ya kullanılmaz hale gelir ya da yanlış kararlar üretir.
Somut bir örnek üzerinden düşünelim: Perakende sektöründe faaliyet gösteren bir şirket, müşteri davranışlarını tahmin etmek için makine öğrenimi kullanmak istiyor. Bunun için geçmiş satış verilerine, müşteri segmentasyonuna ve stok hareketlerine ihtiyaç duyuyor. Ancak satış verileri üç farklı sistemde tutuluyor ve bu sistemlerdeki müşteri kodları birbirleriyle eşleşmiyor. Stok verileri haftalık manuel olarak güncelleniyor ve zaman zaman eksik girişler içeriyor. Bu koşullarda geliştirilen bir tahmin modeli, gerçek dünya performansında beklentilerin çok altında kalacaktır. Toplam sahip olma maliyeti (TCO) hesaplandığında, veri temizleme ve entegrasyon için harcanan süre ve para, modelin kendisine yapılan yatırımı çoğu zaman aşıyor.
Veri stratejisi oluşturmanın önündeki en büyük engel teknik değil, organizasyoneldir. Hangi birimin hangi verinin sahibi olduğu sorusu, çoğu şirkette net bir yanıt bulamıyor. Finans, IT ve operasyon birimleri arasındaki veri sahipliği tartışmaları projeleri yavaşlatıyor. Bunun yanı sıra, veri kalitesini iyileştirmek kısa vadede iş yükü yaratıyor; bu nedenle orta kademe yöneticiler bu çalışmaları ertelemeye eğilimli oluyor. Üst yönetimin veri stratejisini bir IT projesi olarak değil, şirket genelinde bir öncelik olarak benimsemesi ve sahiplenmesi, bu direnci kırmak için zorunlu bir koşul.
Yapay zekâ yatırımı değerlendiren bir yönetici olarak önce şu soruları yanıtlamanız gerekiyor: Hangi iş problemini çözmek istiyorsunuz ve bu problem için hangi verilere ihtiyaç var? Bu veriler şu anda nerede, hangi formatta ve ne sıklıkla güncelleniyor? Veri kalitesini kim, hangi süreçle denetliyor? Eğer bu sorulara net yanıtlar veremiyorsanız, AI bütçenizi önce veri altyapısına yönlendirmek, uzun vadede çok daha yüksek bir ROI sağlayacaktır. Yapay zekâ bir hedef değil, sağlam bir veri stratejisinin üzerine kurulduğunda anlam kazanan bir araçtır.