Skip to main content

Τι είναι η αρχιτεκτονική αποθήκης δεδομένων;

Η αρχιτεκτονική αποθήκης δεδομένων είναι ένα σχέδιο που ενσωματώνει όλες τις πτυχές της αποθήκευσης δεδομένων για ένα επιχειρηματικό περιβάλλον.Η αποθήκευση δεδομένων είναι η δημιουργία ενός κεντρικού τομέα για την αποθήκευση σύνθετων, αποκεντρωμένων δεδομένων επιχειρήσεων σε μια λογική μονάδα που επιτρέπει την εξόρυξη δεδομένων, τις επιχειρηματικές πληροφορίες και τη συνολική πρόσβαση σε όλα τα σχετικά δεδομένα μέσα σε έναν οργανισμό.Η αρχιτεκτονική αποθήκης δεδομένων περιλαμβάνει όλες τις απαιτήσεις αναφοράς, τη διαχείριση δεδομένων, τις απαιτήσεις ασφάλειας, τις απαιτήσεις πλάτους ζώνης και τις απαιτήσεις αποθήκευσης.σχέδιο.Αυτός ο σχεδιασμός θα πρέπει να θεωρείται η μπλε εκτύπωση για την αρχιτεκτονική δεδομένων των επιχειρήσεων.Συγκεκριμένα, πρέπει να αναπτυχθούν αρκετές πρωτογενείς περιοχές κατά την εξέταση της αρχιτεκτονικής αποθήκης δεδομένων.Αυτές οι περιοχές είναι η πρόσβαση του συστήματος προέλευσης, η διαδικασία της περιοχής σταδιοποίησης, η διαδικασία εμπλουτισμού δεδομένων, η αρχιτεκτονική δεδομένων, η διαδικασία επιχειρηματικών πληροφοριών και οι απαιτήσεις αποθήκευσης.

Η αποθήκευση δεδομένων απαιτεί τη μεταφορά δεδομένων πηγής από συναλλαγή ή βάση δεδομένων εγγραφής στην αποθήκη δεδομένων.Αυτή η διαδικασία απλοποιείται στον όρο μετασχηματισμό και φορτίο εκχυλίσματος (ETL), ο οποίος βασικά ενσωματώνει τις περιοχές της πρόσβασης του συστήματος προέλευσης, του εμπλουτισμού δεδομένων και της αρχιτεκτονικής δεδομένων.Για λόγους σαφήνειας, είναι καλύτερο να σχεδιάσουμε λεπτομερώς αυτές τις αρχιτεκτονικές περιοχές, γεγονός που περιγράφει τον τρόπο επιτευχής της διαδικασίας ETL.Ενώ ορισμένα δεδομένα απαιτούνται από τα συστήματα προέλευσης, όλα τα δεδομένα δεν είναι επιθυμητά, καθώς θα επιβαρύνουν την αποθήκη των επιχειρήσεων.Οι κύριοι τομείς που ανησυχούν κατά την αντιμετώπιση του στρώματος του συστήματος προέλευσης είναι οι μεθοδολογίες πρόσβασης δεδομένων, τα δεδομένα που απαιτούνται από το σύστημα προέλευσης και οι απαιτήσεις ανανέωσης.

Το επόμενο αρχιτεκτονικό στρώμα αποθήκευσης δεδομένων που πρέπει να εξεταστεί είναι η διαδικασία της περιοχής σταδιοποίησης.Καθώς τα περισσότερα δεδομένα από τα συστήματα προέλευσης απαιτούν επικύρωση και καθαρισμό δεδομένων, είναι σημαντικό να δημιουργηθεί μια ζώνη προσγείωσης για τη διαμονή των δεδομένων πηγής πριν από τη φόρτωση στο επίπεδο των επιχειρηματικών κανόνων της αποθήκης δεδομένων.Η περιοχή σταδιοποίησης διατηρεί πρώτες τροφοδοσίες δεδομένων από συστήματα πηγής που συνήθως είναι σφραγισμένα χρονικά για να εξασφαλίσουν την πρόσφατη κατάσταση των δεδομένων.

Η διαδικασία εμπλουτισμού δεδομένων ή επιχειρηματικών κανόνων είναι όπου τα δεδομένα καθαρίζονται για να ανταποκριθούν στο επιθυμητό αποτέλεσμα της αποθήκης δεδομένων.Ένα καλό παράδειγμα αυτής της προσέγγισης καθαρισμού είναι η χρήση εργαλείων καθαρισμού διευθύνσεων.Σε περίπτωση που το σύστημα προέλευσης έχει λανθασμένα δεδομένα, η διαδικασία εμπλουτισμού δεδομένων θα εκτελέσει τη διεύθυνση από το σύνολο RAW σε ένα σύστημα επιχειρηματικού κανόνα που θα διορθώσει άκυρες διευθύνσεις.Αυτή είναι και η εποχή όπου τα ανακριβή δεδομένα διαγράφονται ή τροποποιούνται για να εξασφαλιστεί η πληρότητα μέσα στην αποθήκη δεδομένων.

Το επόμενο στρώμα που πρέπει να εξεταστεί είναι το επίπεδο αρχιτεκτονικής δεδομένων.Αυτή η περιοχή είναι όπου ολοκληρώνεται ο αληθινός σχεδιασμός ή το σχήμα της αποθήκης δεδομένων των επιχειρήσεων.Η αποθήκευση δεδομένων δεν είναι ένας συνδυασμός όλων των συνόλων δεδομένων μέσα σε μια επιχείρηση, αλλά αντ 'αυτού είναι μια πρόσφατα καθορισμένη βάση δεδομένων που κατασκευάστηκε για να επιτρέψει μια επισκόπηση όλων των επιχειρηματικών οντοτήτων μέσα στην επιχείρηση.

Αυτό απαιτεί από την αρχιτεκτονική δεδομένων να απαντήσει στις ερωτήσεις που θα τεθούν από την επιχείρηση στον τομέα της επιχειρηματικής νοημοσύνης και της εξόρυξης δεδομένων.Με τη δημιουργία της αρχιτεκτονικής δεδομένων με αυτόν τον τρόπο, τα ακατέργαστα σύνολα δεδομένων θα μετατραπούν σε πίνακες γεγονότων που θα επιτρέψουν στους χρήστες να εκτελούν ad-hoc αναφορές σε ολόκληρη την προβολή των επιχειρήσεων και όχι στη συγκεκριμένη βάση δεδομένων.Αυτή είναι και η περιοχή που θα διατηρήσει μεταδεδομένα σχετικά με τα δεδομένα από το ακατέργαστο σύστημα, τα οποία θα μπορούσαν να περιλαμβάνουν το όνομα του συστήματος προέλευσης ή τα πρωτεύοντα κλειδιά.Αυτό το στρώμα μπορεί να θεωρηθεί ως απαίτηση που αντιμετωπίζει ο χρήστης για την αποθήκευση δεδομένων.Συνήθως, αυτή η περιοχή περιέχει κονσερβοποιημένες αναφορές, ικανότητα ad-hoc αναφοράς και επιχειρησιακές επιβάτες ή ειδοποιήσεις.Η επιχειρηματική ευφυΐαΤα στρώματα E λαμβάνουν συνήθως την μεγαλύτερη προσοχή, καθώς είναι το μόνο στοιχείο προς τα έξω προς τα έξω μέσα στην αποθήκη δεδομένων.

Το τελικό στρώμα για εξέταση είναι οι συνολικές απαιτήσεις αποθήκευσης δεδομένων και συντήρηση.Καθώς η αποθήκη δεδομένων συνεχίζει να αναπτύσσεται και να επεκτείνεται, η αποθήκευση δεδομένων βάσης χρηστών πρέπει να διαχειρίζεται και να διατηρείται αυστηρά.Επιπλέον, δημιουργώντας την αρχιτεκτονική αποθήκης δεδομένων, ο σχεδιασμός θα πρέπει να κάνει ρεαλιστικές εκτιμήσεις σχετικά με το τι θα χρειαστεί να αποτελέσει μια χωρητικότητα αποθήκευσης δεδομένων καθώς και μια ζώνη με χωρητικότητα πρόσβασης δεδομένων.Αυτές οι απαιτήσεις θα είναι κρίσιμες καθώς η αποθήκη δεδομένων θα χρησιμοποιηθεί ευρέως σε όλη την επιχείρηση.