Veri Ambarı Mimarisi Nedir?

Veri ambarı mimarisi, bir kurumsal ortam için tüm veri depolama alanlarını kapsayan bir tasarımdır. Veri depolama, karmaşık, merkezi olmayan kurumsal verileri veri madenciliği, işletme zekası ve bir organizasyon içindeki tüm ilgili verilere genel erişim sağlayan mantıksal bir birimde depolamak için merkezi bir alan oluşturulmasıdır. Veri ambarı mimarisi, tüm raporlama gereksinimlerini, veri yönetimini, güvenlik gereksinimlerini, bant genişliği gereksinimlerini ve depolama gereksinimlerini içerir.

Bir veri ambarı mimarisi oluştururken, mimariyi bütünsel bir nihai tasarıma katılan belirli alanlara bölmek önemlidir. Bu tasarım kurumsal veri mimarisi için mavi baskı olarak kabul edilmelidir. Özellikle, veri ambarı mimarisi göz önüne alındığında birkaç temel alan geliştirilmelidir. Bu alanlar kaynak sisteme erişim, evreleme alanı süreci, veri zenginleştirme süreci, veri mimarisi, iş zekası süreci ve depolama gereksinimleridir.

Veri depolama, kaynak verilerin işlem veya kayıt veritabanından veri ambarına aktarılmasını gerektirir. Bu işlem, temelde kaynak sisteme erişim, veri zenginleştirme ve veri mimarisi alanlarını kapsayan Özü Dönüşüm ve Yük (ETL) terimi ile basitleştirilmiştir. Netlik açısından, ETL sürecinin nasıl sağlanacağını ana hatlarıyla açıklayan bu mimari alanları ayrıntılı olarak tasarlamak daha iyidir. Kaynak sistemlerden bazı veriler gerekli olmakla birlikte, tüm veriler işletme ambarını aşırı yükleyeceği için istenmez. Kaynak sistem katmanını ele alırken öncelikli ilgi alanları veri erişim metodolojileri, kaynak sistemden istenen veriler ve yenileme gereklilikleridir.

Mimari tabakanın göz önünde bulundurulması gereken bir sonraki veri evreleme alanı sürecidir. Kaynak sistemlerinden gelen verilerin çoğu doğrulama ve veri temizliği gerektireceğinden, veri ambarının iş kuralları katmanına yüklenmeden önce kaynak verinin kalması için bir iniş bölgesi oluşturmak önemlidir. Aşama alanı, ham veri beslemelerini, verilerin güncelliğini sağlamak için genellikle zaman damgalı olan kaynak sistemlerinden tutar.

Veri zenginleştirme veya iş kuralları süreci, veri ambarının istenen sonucunu karşılamak için verilerin temizlendiği yerdir. Bu temizleme yaklaşımına güzel bir örnek, adres temizleme araçlarını kullanmaktır; Kaynak sistemde yanlış veri olması durumunda, veri zenginleştirme işlemi adresi ham veri setinden geçersiz adresleri düzelten bir iş kuralı sistemine aktaracaktır. Bu aynı zamanda, veri ambarında tamlığın sağlanması için yanlış verilerin silindiği veya değiştirildiği zamandır.

Dikkate alınacak bir sonraki katman veri mimarisi katmanıdır. Bu alan, kurumsal veri ambarının gerçek tasarımının veya şemasının tamamlandığı yerdir. Veri bir işletmedeki tüm veri kümelerinin bir birleşimi değil, aynı zamanda işletme içindeki tüm işletme varlıklarına genel bir bakış sağlamak için oluşturulmuş yeni tanımlanmış bir veritabanıdır.

Bu, veri mimarisinin, iş zekası ve veri madenciliği alanında, işletme tarafından ortaya çıkacak soruları yanıtlamasını gerektirir. Veri mimarisi bu şekilde yaratılarak, ham veri setleri, kullanıcıların belirli bir veritabanından ziyade tüm kurumsal görünümde geçici raporlama yapmalarını sağlayacak durum tablolarına dönüştürülecektir. Bu, aynı zamanda, kaynak sistem adını veya birincil anahtarları içerebilen, ham sistemdeki veriler hakkındaki meta verileri koruyacak alandır.

Dikkate alınacak bir sonraki alan iş zekası ve raporlama gereklilikleridir. Bu katman, veri depolama için kullanıcının karşı karşıya kaldığı gereklilik olarak düşünülebilir. Genelde, bu alan hazır raporlar, geçici raporlama özelliği ve kurumsal gösterge panoları veya uyarıları içerir. İş zekası katmanları normalde, veri ambarındaki dışa dönük tek bileşen olduğu için en fazla dikkate alır.

Göz önünde bulundurulması gereken son katman genel veri depolama gereklilikleri ve bakımıdır. Bir veri ambarı büyümeye ve genişlemeye devam ettikçe, kullanıcı tabanı veri depolaması kesinlikle yönetilmeli ve korunmalıdır. Ek olarak, veri ambarı mimarisi oluşturulurken tasarım, veri erişim kapasitesine sahip bir bant kadar veri depolama kapasitesi ve neyin gerekli olacağı konusunda gerçekçi tahminlerde bulunmalıdır. Veri ambarı işletme genelinde yaygın bir şekilde kullanıldığından bu gereksinimler kritik olacaktır.