Veri madenciliği ve veri depolama terimleri genellikle hem işletme hem de teknik personel tarafından karıştırılmaktadır. Veri yönetimi alanının tamamı, veri toplama yazılımı programlarının uygulanması ve bilgisayar belleği maliyetinin düşmesiyle olağanüstü bir büyüme göstermiştir. Her iki fonksiyonun da arkasındaki birincil amaç, büyük miktarda veride kalıpları ve anlamları keşfetmek için araçlar ve metodolojiler sağlamaktır.
Veri madenciliği ile veri depolama arasındaki temel farklar sistem tasarımları, kullanılan metodoloji ve amaçtır. Veri madenciliği, örnek tanıma mantığının bir örnek veri setindeki kimlik eğilimlerine göre kullanılması ve bu bilginin daha büyük veri havuzuna karşı tahmin edilmesidir. Veri depolama, daha kolay raporlama sağlamak için veri çıkarma ve saklama işlemidir.
Veri madenciliği, verilerden desen türeten bir dizi iş sürecini tanımlamak için kullanılan genel bir terimdir. Tipik olarak, son kullanıcı tarafından oluşturulan veri setine ve sorgulara dayanarak belirli kalıpları tanımlamak için bir istatistiksel analiz yazılımı paketi kullanılır. Veri madenciliğinin tipik bir kullanım amacı, hedefli pazarlama programları oluşturmak, finansal sahtekarlıkları belirlemek ve davranıştaki olağandışı modelleri güvenlik incelemesinin bir parçası olarak işaretlemektir.
Veri madenciliğinin mükemmel bir örneği, telefon şirketlerinin ürünleri mevcut müşterilere pazarlamak için kullandıkları süreçtir. Telefon şirketi, müşteri bilgileri veritabanına erişmek için veri madenciliği yazılımını kullanır. Belirli bir zaman dilimi içinde temel telefon paketine ve İnternet servisine abone olan müşterileri tanımlamak için bir sorgu yazılır. Bu veri seti seçildikten sonra, bu müşterilerin kaç tanesinin deneme tanıtımı sırasında ücretsiz ek telefon özelliklerinden yararlandığını belirlemek için başka bir sorgu yazılır. Bu veri madenciliği çalışmasının sonuçları, ek telefon hizmetlerinin kullanımını artırmak için bir pazarlama planını iyileştirebilecek veya iyileştirebilecek davranış biçimlerini ortaya koymaktadır.
Veri madenciliğinin temel amacının verilerdeki kalıpları tespit etmek olduğuna dikkat etmek önemlidir. Numune setini tanımlamak için kullanılan şartnamelerin çıktının uygunluğu ve analizin doğruluğu üzerinde büyük etkisi vardır. Yukarıdaki örneğe dönersek, eğer veri seti belirli bir coğrafi bölgedeki müşterilerle sınırlıysa, sonuçlar ve modeller daha geniş bir veri kümesinden farklı olacaktır. Hem veri madenciliği hem de veri depolama büyük miktarda bilgi ile çalışsa da, kullanılan işlemler oldukça farklıdır.
Veri ambarı, büyük miktarda veriyi depolamak ve özel olarak tasarlanmış sorguları ve raporları çalıştırmak için kullanılan bir yazılım ürünüdür. İş zekası, veri depolama ve ilgili işlevsellik üzerine yoğunlaşan büyüyen bir çalışma alanıdır. Bu araçlar, verileri ayıklamak ve gelişmiş sistem performansı sağlamak üzere tasarlanmış bir yöntemde saklamak için tasarlanmıştır. Veri madenciliği ve veri depolama alanındaki terminolojinin çoğu aynıdır ve daha fazla karışıklığa yol açmaktadır.


