Bir perakende zinciri yöneticisi düşünün: elinde satış noktalarından gelen yüz binlerce işlem kaydı, müşteri sadakat programı verisi ve tedarikçi teslimat logları var. Sistem kurulumu için ciddi bir bütçe ayrılmış, sunucu altyapısı genişletilmiş. Ancak altı ay sonra yönetim kurulunun masasında duran tek şey, güzel görselleştirilmiş ama hiçbir kararı değiştirmeyen raporlar. Bu tablo, büyük veri projelerinin en yaygın başarısızlık biçimini özetliyor: teknik kapasite kurulmuş, ama iş sonucuna giden köprü inşa edilmemiş.
Büyük veri kavramı, hacim, hız ve çeşitlilik boyutlarında geleneksel veri tabanı araçlarının işleyemeyeceği veri kümelerini tanımlıyor. Hadoop ekosistemi, kolon bazlı veri ambarları ve akış işleme mimarileri bu ihtiyaca yanıt veren temel teknoloji katmanını oluşturuyor. Ancak bir yöneticinin asıl anlaması gereken nokta şu: teknoloji seçimi, iş probleminin tanımından sonra gelir. Hangi soruyu yanıtlamak istediğinizi bilmeden hangi aracı kullanacağınıza karar veremezsiniz. Bu tersine giden süreç, büyük veri yatırımlarının önemli bir bölümünün beklenen getiriyi sağlayamamasının temel nedeni.
Yol haritasının ilk adımı, kullanım alanı seçimidir. Her sektörün ve her şirket büyüklüğünün farklı bir öncelik sırası vardır. Perakendede müşteri segmentasyonu ve talep tahmini öne çıkarken, üretimde kalite kontrol verisi analizi ve makine arıza öngörüsü daha kritik bir yer tutar. Lojistikte rota optimizasyonu ve teslimat performansı izleme ön plana geçer. İyi bir kullanım alanı seçimi için üç kriter işe yarar: birincisi, veri zaten mevcut mu; ikincisi, bu sorunun yanıtı mevcut süreçlerde gerçekten bir karar değişikliğine yol açar mı; üçüncüsü, sonuç ölçülebilir mi. Bu üç soruya ‘evet’ diyemediğiniz bir kullanım alanı, pilot proje için bile zayıf bir başlangıç noktasıdır.
İkinci adım, ölçüm tasarımıdır. Veri projesinin başarısını değerlendirmek için kullanılacak metrikler, proje başlamadan tanımlanmalıdır. Bir müşteri kayıp tahmini modeli kuruyorsanız, modelin devreye girmesinden önce ve sonraki müşteri elde tutma oranını karşılaştıracak bir kontrol grubu tasarlamak zorundasınız. Bir tedarik zinciri optimizasyon projesi yürütüyorsanız, stok devir hızı ve depo maliyetindeki değişimi izleyecek bir temel ölçüm noktası belirlemeniz gerekiyor. Ölçüm tasarımı olmadan yapılan veri projeleri, başarısını kanıtlayamayan projelerdir; bu da bir sonraki bütçe döneminde yatırımın sürdürülmesini zorlaştırır.
Üçüncü adım, veri kalitesi ve yönetişim altyapısının kurulmasıdır. Türkiye’deki birçok şirket, e-Fatura ve e-Defter uygulamalarıyla birlikte yapılandırılmış işlem verisine erişim konusunda önemli bir avantaj kazandı. Ancak bu veriyi analitik süreçlere besleyebilmek için veri standardizasyonu, tekrarlı kayıt temizleme ve kaynak sistemler arasındaki tutarsızlıkların giderilmesi gerekiyor. Veri yönetişimi, büyük şirketlerin lüksü değil, her ölçekte anlamlı analiz yapmanın ön koşuludur. Bir KOBİ bile veri sahibini, güncelleme sıklığını ve erişim kurallarını tanımlamadan tutarlı analiz üretemez.
Dördüncü adım, organizasyonel hazırlıktır. Teknik altyapı kurulsa bile, analiz sonuçlarını yorumlayacak ve kararlarını bu yorumlara göre şekillendirecek yöneticiler olmadan proje değer üretemez. Bu noktada en sık karşılaşılan sorun, veri ekibi ile iş birimi arasındaki dil farkıdır. Veri analistleri model doğruluğundan söz ederken, satış yöneticisi hangi müşteriye önce arayacağını bilmek ister. Bu boşluğu kapatmak için bazı şirketler ‘veri çevirmenliği’ rolü tanımlıyor; iş süreçlerini ve teknik altyapıyı birlikte anlayan, iki taraf arasında köprü kuran profiller. Bu rol, büyük veri projelerinin başarı oranını belirleyen en kritik insan faktörü olarak öne çıkıyor.
Bir KOBİ yöneticisi bu yol haritasını uygularken şu karar kriterlerini göz önünde bulundurmalıdır: ilk büyük veri projesini kapsamlı bir dönüşüm hedefiyle değil, tek bir somut iş sorusunu yanıtlamak üzere tasarlayın; pilot proje için altı ila on iki aylık bir ölçüm penceresi belirleyin ve başarı kriterini önceden yazılı hale getirin; teknolojiyi seçmeden önce hangi veriyi zaten ürettiğinizi ve bu veriye kimin erişebildiğini haritalayın. Büyük veri yatırımının toplam sahip olma maliyetini hesaplarken lisans ve donanım kalemlerinin yanı sıra veri mühendisi, analist ve iş birimi eğitim maliyetlerini de modele dahil edin. Veriyi iş sonucuna bağlayan köprü, yazılım değil; doğru soruyu soran, ölçümü tasarlayan ve organizasyonu hazırlayan bir süreç disiplinidir.