Bir perakende zincirinin BT yöneticisi, satış noktalarından gelen her işlemi, müşteri hareketlerini, stok değişimlerini ve tedarikçi bildirimlerini ayrı ayrı kayıt altına alıyor. Sunucular dolup taşıyor, yedekleme süreleri uzuyor, ancak haftalık yönetim toplantısında sorulan basit bir soru yanıtsız kalıyor: Hangi ürün grubu, hangi mağazada, hangi saatlerde daha çok satıyor? Veri var; ama cevap yok. Bu tablo, büyük veri tartışmalarında en sık atlanan noktayı gözler önüne seriyor: veri toplamak ile veriyi kullanmak arasındaki mesafe, teknik kapasiteden çok kavramsal bir boşluktan kaynaklanıyor.
Büyük veri kavramı, hacim, hız ve çeşitlilik üçlüsüyle tanımlanıyor. Ancak bu üçlü, neyin toplanacağını değil, toplanabilecek verinin özelliklerini anlatıyor. Yöneticiler için asıl çerçeve farklı bir üçlüye dayanıyor: Ne toplanacak, neden toplanacak ve nasıl kullanılacak? Bu üç soruyu sırayla yanıtlamadan kurulan her veri altyapısı, zamanla yönetilmesi güç bir yük haline geliyor. Çünkü depolama maliyeti düşse de veriyi anlamlandırma maliyeti — insan emeği, yazılım lisansı, analiz süresi — düşmüyor.
‘Ne toplanacak?’ sorusu, teknik bir katalog çalışması değil; önce bir iş sorusu tanımlama egzersizi. Örneğin bir imalat firması ‘müşteri memnuniyetini artırmak istiyoruz’ diyorsa, bu hedef hangi veriyi gerektiriyor? Teslimat süreleri, iade oranları, şikayet kayıtları, belki satış sonrası servis süresi. Bunların dışında kalan her şey — üretim hattındaki sensör verileri, tedarikçi fiyat geçmişi — ayrı bir iş sorusuna bağlanmadan toplanıyorsa, o veri yalnızca depolama maliyeti üretiyor. Amaçtan veriye giden tasarım, veriden amaca giden tahminden her zaman daha verimli çalışıyor.
‘Neden toplanacak?’ sorusu ise kurumsal hafıza ile anlık karar desteği arasındaki ayrımı netleştiriyor. Bazı veriler geçmişi belgelemek için toplanıyor: muhasebe kayıtları, sözleşme arşivleri, personel dosyaları. Bunlar yasal zorunluluk veya denetim ihtiyacından kaynaklanıyor ve saklama politikası belirli. Ancak bazı veriler operasyonel kararları desteklemek için toplanıyor: stok seviyeleri, satış trendleri, müşteri segmentasyonu. Bu iki kategori birbirine karışınca, hem arşiv yönetimi ağırlaşıyor hem de anlık karar desteği için gereken veri, gereksiz gürültünün içinde kayboluyor. Yöneticilerin bu ayrımı yazılı bir veri politikasına dönüştürmesi, büyük veri yatırımının ilk adımı olmalı.
‘Nasıl kullanılacak?’ sorusu ise en çok ertelenen, en çok maliyet üreten nokta. Şirketler veri topluyor, ancak analiz katmanını sonraya bırakıyor. Oysa kullanım senaryosu baştan tanımlanmamışsa, toplanan veri yapısı çoğu zaman analiz aracıyla uyumsuz çıkıyor. Bir satış raporlama aracı için tasarlanmış veri modeli, müşteri davranış analizi için yetersiz kalıyor. Yeniden yapılandırma maliyeti, baştan doğru tasarlamanın çok üzerinde çıkıyor. Bu nedenle ‘nasıl kullanılacak?’ sorusu, teknik ekiple değil; kararları verecek yöneticilerle birlikte yanıtlanmalı. Hangi rapor, hangi sıklıkta, hangi karar için kullanılacak — bu soruların cevabı veri modelinin mimarisini belirliyor.
Pratikte en büyük zorluk, bu üç soruyu aynı anda yanıtlayacak kurumsal olgunluğun henüz yerleşmemiş olması. BT departmanı teknik altyapıyı kuruyor, ancak iş birimlerinden net bir gereksinim tanımı gelmiyor. İş birimleri ise ‘elimizde daha fazla veri olsun’ diyor, ama hangi kararı destekleyeceğini belirtmiyor. Bu boşluk, toplantı odalarında değil; gerçek veri projelerinde — kurulum aşamasında, bütçe tartışmalarında, raporların kullanılmadığı haftalarda — kendini gösteriyor. Orta ölçekli bir şirketin veri yönetimi olgunluğunu artırması için dışarıdan bir danışman kadar, içeride bu üç soruyu sahiplenecek bir koordinatör role ihtiyacı var.
KOBİ yöneticileri için somut karar kriteri şu: Bir veri toplama yatırımına başlamadan önce, her veri kaynağı için tek cümlelik bir iş sorusu yazılabilmeli. ‘Bu veriyi neden topluyoruz?’ sorusuna ‘ileride işe yarar’ veya ‘rakiplerimiz de topluyor’ dışında net bir yanıt yoksa, o veri kaynağını ertelemek hem bütçeyi hem de analiz kapasitesini koruyor. Büyük veri, büyük hacimden önce büyük netlik gerektiriyor.