home

Gudang Data (Data Warehouse)


Gudang Data
Apa itu Gudang Data atau Data Warehouse?
BUILDING THE DATA WAREHOUSE, 2ND EDITION, W H Inmon, John Wiley
A data warehouse is the granular, corporate, integrated historical collection of data that forms the foundation for all sorts of DSS processing, such as data marts, exploration processing, data mining, and the like. A data warehouse is able to be reused and reshaped in many ways.

Gudang Data adalah butiran, perusahaan, sejarah pengumpulan data yang terintegrasi dan membentuk dasar bagi pengolahan DSS, seperti ‘Data Mart’, proses pengolahan eksplorasi, penambangan data dan sejenisnya. Gudang data juga dapat digunakan kembali dan dibentuk kembali dengan berbagai cara.

Kesimpulan :
Gudang Data adalah sekumpulan data yang terintegrasi, membentuk dasar bagi pengolahan DSS, basis data yang berorientasi subjek yang dirancang untuk mendukung fungsi dalam pengambilan keputusan, dmana setiap unit dari data adalag non-volatile dan relevan untuk waktu tertentu.

Arsitektur Data Warehouse
Arsitektur dari gudang data sangat bervariasi tergantung pada situasi spesifik organisasi. Dari variasi tersebut, terdapat tiga arsitektur umum yang berupa :
1.      Arsitektur Dasar Gudang Data
Pada Arsitektur ini, gudang data langsung mengambil data yang berasal dari berbagai data tanpa adanya tahapan pengumpulan data sementara sebelum data masuk ke dalam gudang data.

Pada gambar diatas, Metadata dan Raw Data dari OLTP terdapat didalamnya, dan sebagai tambahan di dalam Warehouse juga terdapat Summary Data. Summary Data ini sangat berguna dalam data Warehouse karena berfungsi untuk melakukan perhitungan yang komploks. Sebagai contoh, Data Warehouse melakukan query untuk mendapatkan data sales di bulan Agustus.

2.      Arsitektur Gudang Data dengan Staging Area
Pada arsitektur ini, terlebih dahulu Data Warehouse membersihkan  data yang berasal dari berbagai data sumber ke suatu tempat penampungan antara (biasanya disebut dengan staging area) sebelum masuk ke Data Warehouse. Staging area  menyeserhanakan proses pembuatan summary dan management warehouse secara umum.


3.      Arsitektur Gudang Data dengan Staging Area dan Data Mart
Pada arsitektur ini, data warehouse akan dibagi lagi menjadi beberapa upabagian sesuai dengan tujuan  maupun penggunaannya (misal : subset penjualan perusahaan, subset pemasaran perusahaan, maupun subset inventaris perusahaan). Upabagian dari data warehouse ini biasa desebut sebagai data mart. Data mart itu sendiri tidak selalu dipandang sebagai suatu uang diturunkan dari data warehouse (pendekatan top-down), tapi data mart itu bias dipandang sebagai komponen penyusun data warehouse (pendekatan bottom-up). Data mart merupakan subset dari data resource, biasanya berorientasi untuk satu tujuan yang spesifik atau subjek data yang didistribusikan untuk mendukung kebutuhan bisnis. Sebagai contoh data purchasing, sales, dan inventory dapat dipisahkan dalam masing-masing cube. Dalam contoh ini seorang analis keuangan dapat menganalisa history data untuk purchases dan sales.

 
Karakteristik Gudang Data
Beberapa karakteristik dari gudang data adalah sebagai berikut :
a.       Subject Oriented 
Data diorganisasikan sesuai dengan kebutuhan user seperti pelanggan, produk, penjualan. Berfokus pada pemodelan dan analisis data untuk pembuat keputusan, bukan pada operasional sehari-hari atau transaksi pemrosesan.
b.      Integrated
Menghilangkan kerancuan dalam hal penamaan dan nilai informasinya.
c.       Nonvolatile
Data yang disimpan dalam format tertentu read only dan tidak dapat diubah oleh user.
d.      Time Variant
Data yang ada di dalam gudang data akan dianalisis perubahannya berdasarkan waktu.
e.       Summarized
Data operasional dikumpulkan kemudian dimapping ke dalam format untuk digunakan dalam pengambilan keputusan.
f.       Large Volume
Ukuran data yang besar karena pemeliharaan data dari waktu ke waktu.
g.      Not Normalized
Data dapat bersifat redudansi karena merupakan gabungan dari beberapa tabel..
h.      Metadata
Data yang disaimpan untuk user dan personil gudang data.
i.        Data Sources
Data yang berasal dari sumber internal maupun eksternal.

Masa Percobaan

Salam Sukses,

Selamat datang di blog baru saya ini, semoga dengan blog ini teman-teman mendapatkan ilmu baru yang akan berguna buat kalian semuanya.

Pada tanggal 13 September 2011 pukul 01.37 saya menulis halaman pengantar pada blog saya ini yang memiliki tujuan agar :
  1. Dapat menceritakan kegiatan-kegiatan saya dengan keluarga besar saya yang selalu mendukung saya dalam berbagai hal baik dalam kuliah maupun dalam hal lainnya.
  2. Dapat menceritakan kegiatan-kegiatan yang berharga maupun kegiatan yang penting baik dari segi pendidikan maupun dari segi di luar pendidikan.
  3. Dapat digunakan untuk mencatat materi kuliah yang sedang saya ambil yaitu Gudang Data yang mengharuskan saya untuk membuat blog ini, semoga dengan adanya blog ini dapat membantu teman-teman untuk menyelesaukan tugas yang berhubungan dengan Gudang Data.
  4. Dapat menceritakan kegiatan saya dengan teman saya yang berada di kampus maupun di luar kampus dengan berbagai kegiatan-kegiatan yang membuat senang, bahagia, sedih, kesal, menjengkelkan dan lain sebagainnya.
Sekian pengantar saya, semoga dengan adanya blog ini dapat bermanfaat untuk para pengguna dunia maya ini.