Veri akışı madenciliği, aktif veri akışından bilgilerin tanımlanmasını ve çıkarılmasını içeren bir stratejidir. Bu yaklaşımla, akışın kendisinde herhangi bir kesinti yaratmadan veriyi çekmek, başkalarının da ekstraksiyon gerçekleşirken bile verileri kullanmasını sağlamaktır. Bu tür veri akışı madenciliği çalışmaları, sesten İnternet üzerinden video aktarımına ve hatta otomatik bir para çekme makinesi kullanarak bir banka hesabından para çekme veya telefon görüşmesi yapma gibi günlük işlere kadar her türlü veriyi içerebilir.
Veri akışı madenciliğinin özelliklerinden biri, istenen bilginin nasıl konumlandırılacağını ve istenen bilgiyi bulmak ve başarılı bir şekilde çıkarmak için ne tür bilgi keşif araçlarının yardımcı olacağını doğru şekilde projelendirme veya tahmin etme yeteneğidir. Örneğin, bir müşteri otomatik vezne makinesi kullanarak bir işlem başlattığında, makine için programlama ilgili hesap bilgileri için bir arama başlatır, verileri bulur ve ardından işlem miktarının hesap bakiyesini izin verilen tutarın altına düşürüp düşürmeyeceğini belirler, hesabın yapılandırılma şekline göre. Oradan, programlama, istenen işlemin başarıyla tamamlandığını belgelemek ve işlemle ilgili kredi veya borç kaydedildikten sonra kalan hesap bakiyesini sağlamak gibi ilgili verileri kullanıcıya verebilir.
Veri akışı madenciliğinin diğer bir yaygın örneği, tarayıcı kullanarak yapılan temel web aramasıdır. Bu uygulama ile son kullanıcı, arama değerlerini bir alana girer ve tarayıcıyı çalıştıran yazılım, bu değerleri yorumlamayı ve arama kriterleri ile ilgisi olan verileri döndürmeyi amaçlamaktadır. Tarayıcının nasıl yapılandırıldığına bağlı olarak, bu aynı zamanda, yapılan araştırmanın amacını öngörmeyi amaçlayan ve aramayı kullanıcının beğenisine göre daha da hassaslaştırmaya yardımcı olabilecek ek kelimeler veya kelime öbekleri sunan bir özellik içerebilir. Kullanıcı arama ifadesine karar verdikten sonra, tarayıcı, tarayıcının kendisinin yapılandırmasına uygun algoritmaları kullanarak sıralama sırasına göre sonuçlar döndürür.
Veri akışı madenciliğinin temel faydalarından biri, başkalarının aynı verileri kullanmasını yasaklamaksızın verilere erişme ve arama yapabilme yeteneğidir. Veri akışları sürekli olarak güncellenmekte olduğundan, çıkartmanın sonuçları zaman zaman değişebilir. Örneğin, belirli bir arama ifadesi kullanarak bir web araması yapmak bugün bir sonuç kümesi verebilir, ancak veri akışına hangi yeni bilgilerin girdiğine ve arama motorunun bu verileri nasıl sıraladığına bağlı olarak yarın biraz farklı bir sonuç kümesi sağlayabilir.


