Skip to main content

Co to są Big Data?

Big Data to pomiary danych, które rosły tak duże, że normalne bazy danych nie są w stanie zawierać i pracować z ogromną ilością informacji.Dane są dostępne w trzech rozmiarach: małych, średnich i dużych;Żadne z tych pomiarów nie jest surowe;Zamiast tego każdy zależy bardziej od łatwości użytkowania i jakiego rodzaju maszyny może obsłużyć informacje.Do dużych zbiorów danych potrzebne są specjalne maszyny, znacznie większe i złożone niż te używane do zwykłych baz danych.Tego rodzaju dane występują zwykle w agencjach rządowych i naukowych, ale niektóre bardzo duże strony internetowe zawierają również tę dużą ilość informacji.

Dane są dostępne w trzech standardach, ale nie surowych rozmiarach.Małe dane mogą zmieścić się na jednym komputerze lub maszynie, na przykład laptopa.Średnie dane są w stanie dopasować się do tablicy dysków i najlepiej zarządzają bazą danych.Bazy danych, bez względu na to, jak duże, nie są w stanie pracować z dużymi zbiorami danych, a zamiast tego użyć specjalnych systemów.Chociaż nie ma ścisłych wytycznych dotyczących tego, czym są duże zbiory danych, zwykle zaczyna się wokół poziomu terabajtów (TB) i przechodzi do poziomu petabyte (PB).

Próba pracy z dużymi danymi na bazie danych, która nie jest do tego wyspecjalizowanaIlość danych spowoduje kilka istotnych problemów.Baza danych nie jest w stanie obsługiwać ilości informacji, więc niektóre dane muszą zostać usunięte.To tak, jakby próbować dopasować 100 gigabajtów (GB) na komputerze z zaledwie 50 GB miejsca na dysku twardym;Nie można tego zrobić.Pozostałe dane będą nieporęczne zarówno do kontroli, jak i zarządzania, ponieważ każda funkcja zajęłaby dużo czasu, a baza danych musi zostać zamknięta na nowe zgłoszenia.

Chociaż możliwe jest zakup maszyn i dodawanie nowych danych do baz danych, Stwarza to nieporęczny problem.Wynika to z faktu, że oprogramowanie do bazy danych ma działać tylko ze średnimi danymi.Większe zestawy danych prowadzą do błędów i problemów administracyjnych, ponieważ oprogramowanie po prostu nie może się poruszać ani pracować z dużymi danymi bez napotkania problemów.

Big Data nie napotyka większości organizacji lub stron internetowych.Agencje obronne i wojskowe wykorzystują tę ilość informacji do tworzenia modeli i przechowywania wyników testów, a wiele dużych agencji naukowych potrzebuje tych specjalistycznych maszyn z podobnych powodów.Niektóre bardzo duże strony internetowe potrzebują dużych maszyn danych, ale strony internetowe nie są tak powszechne jak agencje na tym rynku.Organizacje te muszą zachować wszystkie swoje dane, ponieważ pomaga lepiej analizować przyszłe dane i dokonywać prognoz.