datwarehouse adalah sistem
yang mengambil dan mengkonsolidasikan data yang periodik dari sumber
sistem ke dalam menyimpan data
dimensi atau dinormalisasi. Data Werehouse
terbentuk hanya dengan dua data yaitu data fakta dan data dimensi.
Gambar 1.1 Sebuah diagram
dari data werehouse
Tidak semua sistem data warehouse
memiliki semua komponen yang digambarkan diatas. Dataware house juga bisa
berupa seperti gambar 1.2
 |
Gambar
1.2.Simplestformofadatawarehousesystem
|
Berikut adalah bagian komponen Data warehouse
:
Ø
source systems data yaitu digunakan untuk memeriksa data profile guna
memahami karakteristik data.
Ø
Data
profile yaitu alat yang memiliki kemampuan untuk menganalisis data, seperti mencari tahu
berapa banyak baris dalam setiap tabel, bagaimana. Banyak baris berisi nilai NULL,
dan sebagainya.
Ø The extract, transform, and load
(ETL) system yaitu sistem yang kemampuan untuk terhubung ke sumber sistem, membaca data, mengubah
data, dan beban ke sistem target (target sys-tem tidak harus
menjadi datawarehouse)
Ø dimensional data store (DDS) yaitu sebuah tempat
penyimpanan data database dengan format berbeda.
Ø
Metadata yaitu
sebuah database yang berisi informasi
tentang struktur data, kumpulan
data mining, penggunaan data,
aturan data quality, dan informasi lainnya tentang data.
Ø
data quality (DQ) yaitu sebuah
aturan yang dilakukan guna memriksa kualitas data.
Ø
multidimensional
databases (MDBs) yaitu suatu bentuk database
di mana data disimpan dalam sel
dan posisi setiap sel ditentukan oleh penomoran variabel yang disebut dimensi
di dalam
data warehouse terdapat beberapa sistem proses pengolahan data . sistem
proses tersebut antara lain :
Retrieves Data
sebuah rutinitas yang dilakukan secara luas
oleh ETL sistem. Ada dua pendekatan dalam pengambilan data yaitu ETL (Extract, Transform, Load) atau ELT (Extraxt, Load, Transform). Sistem ETL
adalah serangkaian proses yang mengambil data dari sistem sumber, mengubah
data, dan memuat ke sistem target. Kebanyakan sistem ETL juga memiliki
mekanisme untuk membersihkan data dari sistem sumber sebelum memasukkannya ke data werehouse. Sedangkan ELT, data
dimuat ke dalam data werehousepertama
dalam format baku .Transformasi, pencarian, menduplikasi, dan sebagainya
dilakukan di dalam data werehouse.
Berbeda dengan pendekatan ETL, pendekatan ELT tidak perlu server ETL .
Pendekatan ini biasanya diimplementasikan untuk mengambil keuntungan dari mesin
database data warehouse yang kuat seperti massively parallel processing ( MPP )
sistem.
Consolidates Data
merupakan proses penggabungan data yang dimulai dari
penyedian data atau data yang tersedia,definisi data,konversi data, dan
penyamaan data .
Periodically
sebuah proses
pengambilan data atau mengupdate data source systems. karena Pengambilan
data dan konsolidasi tidak terjadi hanya sekali , mereka terjadi berkali-kali
dan biasanya secara berkala , misalnya setiap hari atau beberapa kali
sehari.jika tidak maka data akan usang .
Dimensi Data Store (DDS / Dimensional Data Store)
Sebuah
DDS adalah satu atau beberapa database yang berisi kumpulan pasar data dimensi.
Sebuahpasar data dimensi adalah sekelompok tabel fakta terkait dan tabel
dimensi yang sesuai mereka yang berisi pengukuran kegiatan bisnis dikategorikan
oleh dimensi mereka.
Dalam dimensi data
store memiliki 3 skema yaitu skema galaksi, skema snowflake , skema bintang .skema tersebut berguna
untuk memodel peristiwa bisnis yang lebih akurat dengan menggunakan beberapa
tabel fakta .
Normalisasi Data
Store(NormalizedDataStore)
Normalisasi
adalah proses menghilangkan redundansi data dengan menerapkan aturan
normalisasi.
History
Proses sistem yang mengatur jejak penyimpan
hasil transaksi data . Salah satu perbedaan utama antara sistem transaksional dan
sistem data warehouse adalah kemampuan dan kapasitas untuk menyimpan rekam
jejak . Kebanyakan sistem transaksional menyimpan beberapa rekam jejak, tetapi
sistem data warehouse menyimpan sejarah yang sangat panjang .
Query
Query adalah proses mendapatkan data dari data store, yang memenuhi kriteria
tertentu.
Business
Intelligence
merupakan kumpulan kegiatan untuk memahami situasi bisnis dengan membentuk
berbagai jenis analisis data perusahaan serta data eksternal dari ketiga pihak untuk membantu membuat keputusan
bisnis strategis, taktis, dan operasional dan mengambil diperlu tindakan untuk meningkatkan kinerja bisnis. Contoh intelijen bisnis adalah sebagai berikut:
·
Business
performance management
·
Customer
profitability analysis
·
Statistical
analysis such as purchase likelihood or basket analysis
·
Predictive
analysis such as forecasting the sales, revenue, and cost
Reporting
digunakan
untuk menyajikan data bisnis kepada pengguna, tetapi mereka juga digunakan
untuk keperluan administrasi data warehousejuga
untuk memantau kualitas data, serta untuk memantau penggunaan aplikasi data warehouse, dan memantau
kegiatan ETL.
Online Analytical Processing (OLAP)
adalah
kegiatan interaktif menganalisis data transaksi bisnis yang disimpan dalam
dimensi data warehouse professional untuk membuat keputusan bisnis taktis dan
strategis.
Data Mining
adalah
proses untuk mengeksplorasi data untuk menemukan pola dan hubungan yang
menggambarkan data dan untuk memprediksi nilai-nilai yang tidak diketahui atau
masa depan data.
Kegiatan Analisa lainnya
Selain
untuk intelijen bisnis, data warehouse juga digunakan untuk kegiatan analisis
dalam tujuan non-bisnis, seperti penelitian ilmiah, departemen pemerintah
(kantor statistik, kantor cuaca, analisis ekonomi, dan prediksi), intelijen
militer, darurat dan manajemen bencana, organisasi amal, monitoring kinerja
server, dan analisis lalu lintas jaringan.
Master Data
Management ( MDM )
Ada dua jenis data master sistem MDM:
• Anda mungkin ingin mengecualikan tanggal dan waktu. Sebuah tanggal menjelaskan acara bisnis, sehingga menurut definisi itu adalah data master.
• Anda mungkin
ingin mengecualikan data master dengan sejumlah kecil anggota.
Tren Masa Depan dalam Data Warehousing
Unstructured Data
Data yang ada di database yang
terstruktur, melainkan diatur dalam baris dan kolom.
Pencarian
Jika Anda menggunakan
aplikasi BI , aplikasi dapat pergi melalui metadata dan menampilkan struktur
data dan kemudian membantu Anda dalam menavigasi melalui data untuk mengambil
informasi yang Anda butuhkan .
Service-Oriented Architecture (SOA)
SOA adalah sebuah metode membangun aplikasi yang menggunakan sejumlah
kecil, komponen independen yang berbicara
satu sama lain dengan menawarkan dan
memakan layanan mereka.
Real-Time Data Warehouse
Sebuah data warehouse
real-time adalah datawarehouse yang diperbarui ( dengan ETL ) yang saat
transaksi terjadi dalam sistem sumber .