
DATA WAREHOUSE
Adalah kumpulan dari komponen-komponen perangkat keras dan perangkat
lunak yang dapat digunakan untuk mendapatkan analisa yang lebih baik dari
data yang berjumlah sangat besar sehingga dapat membuat keputusan yang
baik.
Dengan kata lain sebagai gudang data.
Manfaat Data Warehouse
Data Warehouse biasanya digunakan untuk:
1. Memahami trend bisnis dan membuat perkiraan keputusan yang lebih
baik.
2. Menganalisa informasi mengenai penjualan harian dan membuat
keputusan yang cepat dalam mempengaruhi performance perusahaan.
Data Warehouse Customer Example
Salah satu pelanggan AS/400, menemukan kesulitan dalam hal informasi
penjualan yang dibutuhkan untuk dapat memperluas bisnisnya. Tiap bulan
laporan penjualan sederhana tidak tepat waktu atau tidak mendetail sehingga
sangat tidak membantu. Untuk membantu membuat keputusan bisnis,
perusahaan ini perlu dianalisa latar belakangnya sehingga dapat menemukan
titik-titik trends bisnis.
Dengan AS/400 data warehouse-nya yang baru, para penjual dari
perusahaan ini dapat membentuk strategi penjualan berdasarkan informasi
yang diberikan warehouse. Informasi ini termasuk mengenai the success of
previous promotions, regional trends, product profitability dan the effect of
product packaging.
Perusahaan lain seperti departemen, seperti keuangan dan operasi, juga
menggunakan warehouse untuk mengidentifikasi dan menganalisa produk
yang berhasil menyeberangi daerah, penjualan dan waktu.
Data warehouse dapat sebagai kunci pembeda dalam suatu industri-industri
yang berbeda.
Aplikasi Data Warehouse meliputi:
1. Sales and marketing analysis across all industries.
2. Inventory turn and product tracking in manufacturing.
3. Kategory manajemen, analisa penjualan, dan perbaikan analisa
program pemasaran yang efektif.
4. Keuntungan dari jalan raya atau analisa resiko pengemudi dalam hal
transportasi.
5. Analisa keuntungan atau resiko penetapan pajak atau mendenda
dalam bank.
6. Analisa tuntutan dari deteksi penggelapan dalam asuransi.

Operational data adalah data yang digunakan untuk menjalankan bisnis.
Data ini mempunyai cirri disimpan, diperoleh dan diupdate oleh system Online
Transactional Processing (OLTP). Sebagai contoh, system pemesanan,
aplikasi perhitungan atau an order entry application.
Operational data biasanya disimpan dalam relational database, tetapi
mungkin disimpan dalam legacy hierarchical atau flat formats as well.
Karakteristik operational data meliputi:
1. Sering diperbaharui dan transaksi yang bersifat online.
2. Non-historical data (tidak lebih dari tiga sampai dengan enam bulan
lamanya).
3. Optimized for transactional processing.
4. Tingginya normalisasi dalam relasional database untuk memudahkan
pembaharuan, pemeliharaan dan integritas.
Informational data biasanya disimpan dalam format yang membuat analisa
lebih mudah. Analysis can be in the form of decision support (queries), report
generation, executive information systems.
Informational data dibuat dari operational data kekayaan yang ada di dalam
bisnis anda.
Informational data adalah apa yang membentuk sebuah data warehouse.
Ciri informational data:
1. Summarized operational data.
2. De-normalized and replicated data.
3. Infrequently updated from the operational data.
4. Optimized for decision support applications.
5. Possibly read-only (no updates allowed).
6. Stored on separate system to lessen impact on operational system.
Metadata
Informasi mengenai data warehouse dan data yang diisi ke dalam Data
warehouse dibagi dua bagian. Yang pertama technical data the warehouse
uses, dan yang kedua business data that is of use to the warehouse users.
Semua data ini menunjukkan sebagai metadata, data about the data.
The technical data berisi penjelasan tentang operational database dan
penjelasan dari data warehouse. Dari kedua penjelasan itu, atau skema,
operasi pergerakan data dpat diimplementasikan. Data ini membantu
administrasi data warehouse menjaga datanya dan mengetahui dari mana
semua data berasal.
The business data membantu pemakai mencari informasi dalam data
warehouse tanpa mengetahui implementasi databasenya. (This information is

when the database was built)
The business data memberikan informasi kepada pemakai:
1. Pada saat data dipindahkan ke dalam warehouse (how current it is)
2. Dari mana data berasal. (which operational database).
3. Other information that lets the user know how reliable the data is.
Business Intelligence Software and Data Mining
Business intelligence software is a fairly new term referring to the tools that
are used to analize the data.
Software ini terdiri dari:
1. Decision Support System (DSS) tools
Dimana diijinkan untuk membangun ad hoc queries and generate
reports.
2. Executive information system (EIS).
Which combine decision support with extended analysis capabilities
and access to outside resources (such as Dow Jones News Services)
3. Data Mining tools.
Which allow automation of the analysis of your data to find patterns or
rules that you can use to tailor business operations.

Definisi Data Mining adalah
1. Mencari informasi yang berharga di dalam suatu data yang berjumlah
besar.
2. Eksplorasi dan analisa secara otomatis atau semiotomatis dari suatu
kuantitas data yang besar yang bertugas untuk mencari pola dan
aturan yang berarti.
KDD Process
Knowledge Discovery in Databases (KDD) is a non-trivial process of
identifying valid, novel, potentially useful, and ultimately understandable
patterns in data.
BUSSINESS CYCLE OF DATA MINING
Alasan-alasan menggunakan Data Mining
1. Karena data dikumpulkan dan disimpan dengan kecepatan yang
sangat besar (Gbyte/hour).
− Sensor jarak jauh yang menggunakan satelit.
− Telescope scanning the skies.
− Micro arrays generating gene expression data.
− Scientific simulations generating terabytes of data

3. Digunakan untuk mereduksi data atau data dibagi-bagi.
− Catalog, klasifikasi, pembagian data.
− Membantu para ahli sains dalam menghipotesa.
Asal mula Data Mining :
1. Penggambaran ide-ide dari Mesin Buatan atau Artificial Intelligent,
pola, statistik, sistem database dan penggambaran data.
2. Tehnik tradisional mungkin tidak digunakan karena
− Banyaknya data.
− Tingginya dimensi dari suatu data.
− Berbagai macam jenis data.
Tugas Data Mining dibagi menjadi dua metode yaitu:
1. Metoda prediksi
Menggunakan beberapa variable untuk memperkirakan suatu nilai
yang tidak diketahui dari variable yang lain.
2. Metoda deskripsi
Mencari suatu pola yang dapat ditafsirkan manusia sehingga data
dapat digambarkan atau diuraikan.
Jenis-jenis Tugas Data Mining
1. Classification [Predictive]
2. Clustering [Descriptive]
3. Association Rule Discovery [Descriptive]
4. Regression [Predictive]
5. Deviation Detection [Predictive]
Definisi Klasifikasi
1. Memberikan kumpulan record-record (training set)
− Setiap record berisi sifat-sifat tertentu (attributes), salah satu
dari attributes adalah kelas (class).
2. Mencari sebuah contoh atau model untuk class attribute sebagai fungsi
dari suatu nilai dari attribute yang lain.
3. Tujuannya adalah record2 yang tidak kelihatan/ previously unseen
record ditunjuk menjadi suatu class setepat mungkin.
No comments:
Post a Comment