Skip to main content

Apa itu Arsitektur Gudang Data?

Arsitektur Gudang Data adalah desain yang merangkum semua aspek pergudangan data untuk lingkungan perusahaan.Pergudangan data adalah pembuatan domain pusat untuk menyimpan data perusahaan yang kompleks dan terdesentralisasi dalam unit logis yang memungkinkan penambangan data, kecerdasan bisnis, dan akses keseluruhan ke semua data yang relevan dalam suatu organisasi.Arsitektur Gudang Data termasuk semua persyaratan pelaporan, manajemen data, persyaratan keamanan, persyaratan lebar pita, dan persyaratan penyimpanan.

Saat membuat arsitektur gudang data, penting untuk memecah arsitektur menjadi domain tertentu yang bergabung dalam final holistik final holistikdesain.Desain ini harus dianggap sebagai cetakan biru untuk arsitektur data perusahaan.Secara khusus, beberapa bidang utama harus dikembangkan ketika mempertimbangkan arsitektur gudang data.Area ini adalah akses sistem sumber, proses area pementasan, proses pengayaan data, arsitektur data, proses intelijen bisnis, dan persyaratan penyimpanan.

Pergudangan data memerlukan data sumber untuk ditransfer dari transaksional atau database catatan ke dalam gudang data.Proses ini disederhanakan ke dalam istilah transformasi ekstrak dan beban (ETL), yang pada dasarnya merangkum area akses sistem sumber, pengayaan data, dan arsitektur data.Demi kejelasan, lebih baik merancang area arsitektur ini secara rinci, yang menguraikan bagaimana proses ETL akan dicapai.Sementara beberapa data diperlukan dari sistem sumber, semua data tidak diinginkan karena akan membebani gudang perusahaan.Area utama yang menjadi perhatian saat menangani lapisan sistem sumber adalah metodologi akses data, data yang diperlukan dari sistem sumber, dan menyegarkan persyaratan.

Lapisan arsitektur pergudangan data berikutnya untuk dipertimbangkan adalah proses pementasan.Karena sebagian besar data dari sistem sumber akan memerlukan validasi dan pembersihan data, penting untuk membuat zona pendaratan untuk data sumber untuk tinggal sebelum memuat ke lapisan aturan bisnis gudang data.Area pementasan memelihara umpan data mentah dari sistem sumber yang biasanya dicap waktu untuk memastikan kinimal data.

Pengayaan data atau proses aturan bisnis adalah tempat data dibersihkan untuk memenuhi hasil yang diinginkan dari gudang data.Contoh yang baik dari pendekatan pembersihan ini adalah menggunakan alat pembersih alamat;Jika sistem sumber memiliki data yang salah, proses pengayaan data akan menjalankan alamat dari data mentah yang disetel ke dalam sistem aturan bisnis yang akan memperbaiki alamat yang tidak valid.Ini juga waktu di mana data yang tidak akurat dihapus atau dimodifikasi untuk memastikan kelengkapan di dalam gudang data.

Lapisan berikutnya yang akan dipertimbangkan adalah lapisan arsitektur data.Area ini adalah tempat desain atau skema yang sebenarnya dari gudang data perusahaan selesai.Warehousing data dalam bukan kombinasi dari semua set data dalam suatu perusahaan, tetapi sebaliknya itu adalah database yang baru didefinisikan yang dibangun untuk memungkinkan gambaran umum semua entitas bisnis dalam perusahaan.

Ini membutuhkan arsitektur data untuk menjawab pertanyaan yang akan diajukan oleh bisnis di bidang intelijen bisnis dan penambangan data.Dengan membuat arsitektur data dengan cara ini, set data mentah akan diubah menjadi tabel fakta yang akan memungkinkan pengguna untuk melakukan pelaporan ad-hoc pada seluruh tampilan perusahaan daripada database tertentu.Ini juga merupakan area yang akan mempertahankan metadata tentang data dari sistem mentah, yang dapat mencakup nama sistem sumber atau kunci utama.

Area berikutnya yang perlu dipertimbangkan adalah persyaratan intelijen dan pelaporan bisnis.Lapisan ini dapat dianggap sebagai persyaratan yang menghadap pengguna untuk pergudangan data.Biasanya, area ini berisi laporan kalengan, kemampuan pelaporan ad-hoc, dan papan dasbor perusahaan atau peringatan.Kecerdasan bisnisLapisan biasanya mendapatkan pertimbangan terbanyak, karena merupakan satu-satunya komponen yang menghadap ke luar dalam gudang data.

Lapisan akhir untuk dipertimbangkan adalah persyaratan dan pemeliharaan penyimpanan data secara keseluruhan.Saat gudang data terus tumbuh dan berkembang, penyimpanan data basis pengguna harus dikelola dan dipelihara secara ketat.Selain itu, saat membuat arsitektur gudang data, desain harus membuat perkiraan yang realistis mengenai apa yang diperlukan membentuk kapasitas penyimpanan data serta band dengan kapasitas akses data.Persyaratan ini akan sangat penting karena gudang data menjadi banyak digunakan di seluruh perusahaan.