50 contoh soal Data Integration
1. Apa yang dimaksud dengan
Database?
Kumpulan informasi
yang disimpan di dalam komputer secara sistematik sehingga dapat
diperiksa
menggunakan suatu program komputer untuk memperoleh informasi dari basis data
tersebut.
2. Apakah kepanjangan DBMS dan sebutkan
pengertiannya?
DBMS singkatan dari (Database
Management Systems)
DBMS adalah perangkat lunak yang
menangani semua pengaksesan database yang mempunyai
fasilitas membuat, mengakses, memanipulasi dan memelihara basis data.
3. Apakah yang dimaksud dengan Sistem Basis
Data dan element apa saja yang terdapat di dalamnya ?
Basisdata atau Database adalah kumpulan
dari berbagai data/informasi yang saling
berhubungan satu sama lain, disimpan di dalam perangkat keras (komputer)
secara sistematis sehingga dapat diolah menggunakan perangkat lunak. Perangkat
lunak yang digunakan untuk mengelola dan memanggil kueri basis data disebut
sistem manajemen basis data (database management system atau disingkat DBMS).
Elemen – Elemen basis data:
· Entitas
· Atribut
· Data Vilue (Nilai Data)
· File / Tabel
· Record / Tuple
4. Dari
sekian DBMS yg ada, DBMS apa yang menjadi pilihan anda dan sebutkan alasannya ?
Oracle
Karena Oracle merupakan salah satu
software sistem basis data relasional yang banyak dikenal dan diminati, versi
terbaru dari Oracle adalah Oreacle 11g. Sogtware ini bisa digunakan untuk
pengaksesan data yang dilakukan secara online.
5. Menurut anda, pentingkah peng implementasian
Sistem Basis Data dalam dunia kerja, sebutkan
alasannya !
Menurut saya, implementasi dalam Dunia
kerja itu penting. Selain mempermudah pekerjaan implementasi juga di unggulkan
untuk mencopy atau mentransfer data dari suatu database ke database lain yang
tersimpang pada komputer yang lain.
6. Siapakah seorang DBA itu ?
Tenaga ahli yang mempunyai tugas untuk
mengontrol sistem basis data secara keseluruhan, meramalkan kebutuhan akan
sistem basis data, merencanakannya dan mengaturnya.
7. Jelaskan dan berikan contoh pengertian dari
DDL (data definition language) ?
Struktur / skema basis data yang
menggambarkan / mewakili desain basis data secara keseluruhan dispesifikasikan dengan bahasa
khusus yaitu DDL. Dengan bahasa ini kita dapat membuat tabel (create table)
baru, indeks, mengubah table, menentukan struktur penyimpanan table, dan lainnya.
Hasil dari kompilasi perintah DDL, adalah kumpulan table yang disimpan dalam
file khusus yang disebut kamus data (data dictionary).
8. Jelaskan pengertian dan berkan contoh dari
DCL (data control language)
DCL adalah inti dari SQL yang mempunyai
kemampuan untuk mengatur hak asasi terhadap sebuah basis data (database)
Contoh:
a. Grant adalah
memberikan hak-hak tertentu kepada seorang user. Grant diberikan oleh user
yang mempunyai hak untuk memberikan grant atau administrasi (root).
b. Revoke adalah kebalikan dari
grant, mencabut hak user terhadap database.
9. Jelaskan pengertian daripada Query ?
Query adalah pernyataan yang diajukan
untuk mengambil informasi di dalam suatu basis data. Query merupakan bagian
dari DML yang untuk pengambilan informasi disebut Query Language.
10. Jelaskan pengertian database administrator,
fungsi apa saja yang harus dilakukan oleh database administrator ?.
database administrator adalah orang
yang mempunyai kekuasaan sebagai pusat pengontrolan terhadap seluruh system
baik data maupun program yang mengakses data
Fungsi database administrator:
a. Mendefinisikan pola struktur
database.
b. Mendefinisikan struktur
penyimpanan dan metode akses.
c. Mampu memodifikasi pola dan
organisasi phisik.
d. Memberikan kekuasaan pada user
untuk mengakses data.
e. Membuat spesifikasi keharusan
integritas data.
11. Berikan penjelasan tentang karakteristik
data untuk table matakuliah, jurusan dan mengajar ?.
Secara minimal yang harus
ditentukan dalam struktur table adalah :
a. Nama kolom (field / atribut).
b. Tipe data (data type)
c. Lebar (banyaknya karakter /
dijit maksimum yang dapat ditampung.
d. Pendefinisian kolom (apakah
null atau not null)
12. kenapa perusahaan mengembangkan Data
Warehouse?
Sebagai salah satu alternatif bagi
perusahaan sebagai struktur penyimpanan data yang juga dapat memperbaiki
pengolahan dan penggalian data, terutama dalam membangun sebuah pola hubungan
antar data dan mengetahui informasi penting yang tersembunyi di dalam database
13. apakah yang dimaksud denormalisasi?
Denormalisasi merupakan proses yang
dilakukan pada database yang sudah dinormalisasi, dengan cara memodifikasi
struktur tabel dan mengabaikan kerangkapan data (yang terkontrol) untuk
meningkatkan kinerja database.
Proses denormalisasi termasuk :
·
Mengkombinasikan tabel-tabel yang terpisah
dengan join
·
Mereplikasi/menduplikat data pada table
14. Jelaskan pengertian datamining dan KDD!
Serangkaian proses untuk menggali nilai
tambah berupa informasi yang selama ini tidak diketahui secara manual dari
suatu basisdata. Informasi yang dihasilkan diperoleh dengan cara mengekstraksi
dan mengenali pola yang penting atau menarik dari data yang terdapat dalam
basisdata.
15. Sebutkan hal-hal yang melatarbelakangi
datamining?
·
Melimpahnya data (overload data) yang dialami
oleh berbagai institusi, perusahaan atau organisasi.
·
Merlimpahnya data ini merupakan akumulasi data
transaksi yang terekam bertahun-tahun..
·
Data–data tersebut merupakan data transaksi yang
umumnya diproses menggunakan aplikasi komputer yang biasa disebut dengan OLTP
(On Line Transaction Processing).
16. Sebutkan dan jelaskan manfaat penggunaan
datamining?
Dari sudut pandang komersial,
pemanfaatan dataming dapat digunakan
dalam menangani meledaknya volume data. Bagaimana mana menyimpannya, mengestraknya serta memanfaaatkannya.
Berbagai teknik komputasi dapat digunakan menghasilkan informasi yang
dibutuhkan. Informasi yang dihasilkan menjadi asset untuk meningkatkan daya
saing suatu institusi. Data mining tidak hanya digunakan untuk menangani
persoalan menumpuknya data/informasi dan bagaimana menggudangkannya tanpa
kehilangan informasi yang penting (warehousing). Data mining juga diperlukan
untuk menyelesaikan permasalahan atau menjawab kebutuhan bisnis itu sendiri,
misalnya:
·
Bagaimana mengetahui hilangnya pelanggan karena
pesaing
·
Bagaimana mengetahui item produk atau konsumen
yang memiliki kesamaan karakteristik
·
Bagaimana mengidentifikasi produk-produk yang
terjual bersamaan dengan produk lain.
·
Bagaimana memprediski tingkat penjualan
·
Bagaimana menilai tingkat resiko dalam
menentukan jumlah produksi suatu item.
·
Bagaimana memprediksi prilaku bisnis di masa
yang akan datang
·
Remote sensor yang ditempatkan pada suatu
satelit
·
Telescope yang digunakan untuk memindai langit
·
Simulasi saintifik yang membangkitkan data dalam
ukuran terabytes
17. Sebutkan dan jelaskan manfaat secara singkat
tahap KDD?
KDD adalah keseluruhan proses
non-trivial untuk mencari dan mengidentifikasi pola (pattern) dalam data,
dimana pola yang ditemukan bersifat sah, baru, dapat bermanfaat dan dapat
dimengerti. Serangkaian proses tersebut yang memiliki tahap sebagai berikut
Pembersihan data dan integrasi data (cleaning and integration)
Proses ini digunakan untuk membuang
data yang tidak konsisten dan bersifat noise dari data yang terdapat di
berbagai basisdata yang mungkin berbeda format maupun platform yang kemudian
diintegrasikan dalam satu database datawarehouse.
18. Sebutkan dan jelaskan berbagai metode
seleksi?
·
Sampling, adalah seleksi subset representatif
dari populasi data yang besar.
·
Denoising, adalah proses menghilangkan noise
dari data yang akan ditransformasikan
·
Feature extraction, adalah proses membuka
spesifikasi data yang signifikan dalam konteks tertentu.
19. Sebutkan dan jelaskan berbagai metode
transformasi?
·
Centering, mengurangi setiap data dengan
rata-rata dari setiap atribut yang ada.
·
Normalisation, membagi setiap data yang
dicentering dengan standar deviasi dari atribut bersangkutan.
·
Scaling, mengubah data sehingga berada dalam skala
tertentu.
20. Sebutkan dan jelaskan minimal 4 fungsi yang
umum diterapkan dalam datamining?
·
Assosiation, adalah proses untuk menemukan
aturan assosiatif antarasuatu kombinasi item dalam suatu waktu
·
Secuence, hampir sama dengan association bedanya
seccuencediterapkan lebih dari satu periode.
·
Clastering, adalah proses pengelompokan sejumlah
data/obyek kedalam kelompok-kelompok data (klaster) sehingga setiap klaster
akanberisi data yang saling mirip.
·
Classification, adalah proses penemuan model
atau fungsi yangmenjelaskan atau membedakan konsep atau kelas data, dengan
tujuanuntuk dapat memperkirakan kelas dari suatu objek yang labelnya
tidakdiketahui.
21. Berikan 4 contoh dan penjelasan implementasi
datamining?
Analisa Pasar dan Manajemen
Untuk analisa pasar,
banyak sekali sumber data yang dapat digunakan seperti transaksi kartu kredit,
kartu anggota club tertentu, kupon diskon, keluhan pembeli, ditambah dengan
studi tentang gaya hidup publik.
Telekomunikasi
Sebuah perusahaan
telekomunikasi menerapkan data mining untuk melihatdari jutaan transaksi yang
masuk, transaksi mana sajakah yang masih harusditangani secara manual (dilayani
oleh orang). Tujuannya tidak lain adalahuntuk menambah layanan otomatis khusus
untuk transaksi-transaksi yangmasih dilayani secara manual. Dengan demikian
jumlah operator penerimatransaksi manual tetap bisa ditekan minimal.
Keuangan
me-nambang
trilyunan dari berbagai subyek seperti property, rekening bank dan transaksi
keuangan lainnya untuk mendeteksi transaksi-transaksi keuangan yang
mencurigakan (seperti money laundry). Mereka menyatakan bahwa hal tersebut akan
susah dilakukan jika menggunakan analisis standar.
(www.senate.gov/~appropriations/treasury/testimony/sloan.htm. Mungkinsudah
saatnya juga Badan Pemeriksa Keuangan Republik Indonesia menggunakan teknologi
ini untuk mendeteksi aliran dana BLBI.
Asuransi
Australian Health Insurance Commision
menggunakan data mining untukmengidentifikasi layanan kesehatan yang sebenarnya
tidak perlu tetapi tetap dilakukan oleh peserta asuransi. Hasilnya? Mereka
berhasil menghemat satu juta dollar per tahunnya. ATentu saja ini tidak hanya
bias diterapkan untuk asuransi kesehatan, tetapi juga untuk berbagai jenis
asuransi lainnya.
22. Jelaskan pengetian dari metodologi
datamining berikut ini?
·
Regresi, Adalah fungsi pembelajaran yang
memetakan sebuah unsure data ke sebuah variable prediksi bernilai nyata.
·
Jaringan syaraf tiruan, Adalah jaringan dari
sekelompok unit pemroses kecil yang dimodelkan berdasarkan jaringan saraf
manusia. JST merupakan sistem adaptif yang dapat merubah strukturnya untuk
memecahkan masalah berdasarkan informasi eksternal maupun internal yang
mengalir melalui jaringan tersebut.
·
Pohon keputusan,
adalah digunakan untuk memodelkan persoalan yang terdiri dari serangkaian
keputusan yang mengarah ke solusi. Tiap simpul dalam menyatakan keputusan,
sedangkan daun menyatakan solusi.
·
Algoritma genetika, adalah teknik pencarian yang
di dalam ilmu komputer untuk menemukan penyelesaian perkiraan untuk optimisasi
dan masalah pencarian. Atau juga dapat disebut kelas khusus dari algoritma
evolusioner dengan menggunakan teknik yang terinspirasi oleh biologi
evolusioner seperti warisan, mutasi, seleksi alam dan rekombinasi (atau
crossover)
23. Jelaskan pengertian dari istilah-istilah
warehousing berikut ini?
·
Datamart, adalah Data warehouse yang mendukung
kebutuhan pada tingkat departemen atau fungsi bisinis tertentu dalam
perusahaan.
·
OLAP, adalah sebuah pendekatan secara cepat
menyediakan jawaban-jawaban terhadap kueri analitik yang multidimensi di dalam
alam. OLAP adalah bagian dari kategori yang lebih global dari pemikiran bisnis,
yang juga merangkum hubungan antara pelaporan dan penggalian data.
·
Dimention Table, adalah satu kumpulan tabel
teman untuk meja fakta.
·
Fact Table, adalah tabel yang berisi pengukuran
tentang meter atau fakta cara bisnis . itu sering ditempatkan pada memusat
skema bintang dan dikelilingi oleh tabel ukuran
24. Jelaskan perbedaan-perbedaan antara data
operasional dengan data warehouse?
Data Operasional
Dirancang berorientasi hanya pada aplikasi dan fungsi tertentu
Fokusnya pada desain basisdata dan proses
Berisi rincian atau detail data
Relasi antar
table berdasar aturan terkini(selalu mengikuti aturan terbaru)
Data Warehouse
Dirancang berdasar pada subjek-subjek tertentu (utama)
Focusnya pada pemodelan data dan desain data
Berisi data-data history yang akan dipakai dalam proses analisis
Banyak aturan bisnis dapat tersaji antara tabel-tabel
25. Sebutkan dan jelaskan secara singkat
tugas-tugas yang dilakukan data warehouse?
- Pembuatan laporan, Pembuatan laporan merupakan salah
satu kegunaan data warehousing yang paling umum dilakukan. Dengan
menggunakan query sederhana didapatkan laporan perhari,perbulan, pertahun
atau jangka waktu kapanpun yang diinginkan.
- On-Line Analytical Processing (OLAP), Dengan adanya data
warehouse, semua informasi baik detail maupun hasil summary yang
dibutuhkan dalam proses analisa mudah didapat. OLAP mendayagunakan konsep
data multi dimensi dan memungkinkan para pemakai menganalisa data sampai
mendetail, tanpa mengetikkan satupun perintah SQL. Hal ini dimungkinkan
karena pada konsep multi dimensi, maka data yang berupa fakta yang sama
bisa dilihat dengan menggunakan fungsi yang berbeda. Fasilitas lain yang
ada pada sofware OLAP adalah fasilitas rool-up dan drill-down. Drill-down
adalah kemampuan untuk melihat detail dari suatu informasi dan roll-up
adalah kebalikannya.
- Proses informasi eksekutif, data warehousing dapat
membuat ringkasan informasi yang penting dengan tujuan membuat keputusan
bisnis, tanpa harus menjelajahi keseluruhan data. Dengan menggunakan data
warehousing segala laporan telah diringkas dan dapat pula mengetahui
segala rinciannya secara lengkap, sehingga mempermudah proses pengambilan
keputusan. Informasi dan data pada laporan data warehousing menjadi target
informatif bagi pengguna.
26. Sebutkan 4 keuntungan menggunakan data
warehouse!
- Data diorganisir dengan baik untuk query analisis dan
sebagai bahan untuk pemrosesan transaksi.
- Perbedaan diantara struktur data yang heterogen pada
beberapa sumber yang terpisah dapat diatasi.
- Aturan untuk transformasi data diterapkan untuk
memvalidasi dan mengkonsolidasi data apabila data dipindahkan dari
basisdata OLTP ke data warehouse
- Masalah keamanan dan kinerja bisa dipecahkan tanpa perlu
mengubah sistem produksi.
27. Sebutkan dan jelaskan secara singkat tiga
jenis dasar sistem data warehouse?
- Data Warehouse Fungsional, Data warehouse dibuat lebih
dari satu dan dikelompokan berdasar fungsi yang ada di dalam perusahaan
seperti fungsi keuangan, marketing dan personalia.
- Data Warehouse Terpusta, Sumber data dikumpulkan dalam
satu tempat tempat terpusat, kemudian data tersebar ke dalam fungsinya
masing-masing sesuai kebutuhan perusahaan.
- Data Warehouse Terdistribusi, dalam warehouse ini
digunakan gateway yang berfungsi sebagai jemabatan penghubung antara data
warehouse dengan workstation yang menggunakan sistem beranek ragam. Jadi
dapat perusahaan dapat mengakses sumber data yang berada di luar lokasi
perusahaan.
28. Sebutkan 3 jenis dasar dan kelebihan dari 3
jenis dasar sistem data warehouse!
- Data Warehouse Fungsional, yaitu sistem mudah dibangun
dengan biaya relatif murah.
- Data Warehouse Terpusat, yaitu data benar-benar terpadu
karena konsistensinya yang tinggi.
- Data Warehouse Terdistribusi,nya yaitu data tetap
konsisten karena sebelum data di gunakan data terlebih dahulu di sesuaikan
atau mengalami proses sinkronisasi.
29. Sebutkan dan jelaskan komponen dari struktur
data warehouse!
- Current detail data, data detail yg aktif saat ini
- Older detail data, “Merupakan data historis dari curen
detail data
- Lightly summarized data, merupakan hasil ringkasan dari
curen detail data
- Highly summarized data, Merupakan hasil ringkasan yang
bersifat totalitas
- Metadata, data tentang data
30. Sebutkan dan jelaskan 4 tahap awal
metodologi dalam perancangan basis data
untuk data warehouse?
Predictive
modeling,Adalah untuk membantu model untuk memprediksi suatu nilai yang
mempunyai cirri-ciri tertentu.
Association
analysis, adalah untuk menghasilkan sejumlah rule yang menjelaskan sejumlah
data yang terhubung kuat satu dengan yang lainnya.
Clustering,Adalah
untuk mengelompokan data yang sejenis sehingga data yang berada di cluster yang
sama mempunyai banyak kesamaan dibandingkan dengan data yang ada di cluster
yang berbeda.
Anomaly
detection, adalah untuk menemukan anomaly atau outlier yaitu data yang
berbeda dengan data-data yang lainnya.
31. Jelaskan yang dimaksud dengan Distribution
channel
Distribution channel adalah cara mengantarkan
barang atau produk agar sampai ke tangan konsumen.
Adapun cara-caranya antara lain yaitu
yang pertama distribusi langsung (mengantarkan barang atau produk yang
dilakukan sendiri) biasanya dengan cara mempunyai toko dan outlet sendiri.
Kedua adalah perantara (cara ini tidak menjual langsung biasanya mengantarkan
barang melalui warung, agen, dan supermarket). Cara ketiga yaitu hybird
(campuran cara distribusi langsung dengan perantara jadi tidak hanya
mengantarkan atau menjual barang secara langsung tetapi juga melewati
perantara). Cara keempat yaitu telemarketing (melakukan penjualan melalui alat
komunikasi). Cara selanjutnya yaitu elemance atau yang disebut juga dengan
electronic comerse (menjual barang atau produk melalui perantara yang
menggunakan media internet lewat dunia maya seperti facebook, web, dan
sebagainya). Cara yang terakhir merupakan cara yang sering didengar dan populer
dikalangan masyarakat sekarang ini yaitu Multi Level Marketing disebut juga
dengan singkatan MLM (menjual produk hanya dengan katalog tanpa harus membawa
produknya terlebih dahulu, contoh Oriflame dan Sophie Martin).
32. Jelaskan yang dimaksud dengan Organizational
unit
Unit organisasi (OU) adalah metode yang
digunakan dalam administrasi sistem komputer untuk mengelompokkan dan mengatur
berbagai komponen struktur organisasi untuk kemudahan manajemen. Secara
konseptual, OU dapat dilihat sebagai sesuatu wadah untuk memilah struktur
organisasi, memungkinkan untuk perubahan yang akan diterapkan pada salah satu
tingkat dalam hirarki. Apa pun bisa masuk ke dalam wadah OU, termasuk
orang-orang, kelompok orang, sistem komputer, atau seluruh jaringan.
33. Jelaskan yang dimaksud dengan IDES
IDES (Demonstrasi Internasional dan
Sistem Pendidikan) tergantung pada kolaborasi dengan mitra bisnis eksternal dan
pandangan global perusahaan internasional.
IDES AG adalah operetes manufaktur
company.It di seluruh dunia dan memiliki sejumlah proses subsidiaries.This
perusahaan menggunakan selama corse pelatihan ini untuk menunjukkan solusi yang
disediakan oleh SAP
Sebagai perusahaan model, IDES memiliki
sejumlah besar cabang bisnis dan proses subsidiaries.Business-cabang tertentu
sepenuhnya mengatur dan mencakup semua bidang utama, seperti pembelian,
penjualan, pemasaran, dan manufaktur.
Sebagai perusahaan internasional, IDES
memiliki beberapa kepemilikan dan membutuhkan kemampuan untuk melaporkan kepada
pemegang saham pada tujuan sebuah bases.Management internasional selama tahun
depan adalah untuk meningkatkan profits.Costing laporan analisis, laporan
manajemen kas, dan laporan biaya overhead harus ditangkap untuk sistem
intelijen bisnis untuk tinjauan manajemen
IDES AG menghasilkan banyak
products.Products diproduksi di sejumlah perencanaan lokasi produksi
worldwide.Global memastikan bahwa pengiriman dilakukan dari pusat distribusi
terdekat.
34. Hubungan master data dengan aplikasi yang
ada di SAP adalah
Di SAP master data dibuat secara
terpusat dan tersedia untuk semua aplikasi dan semua yang berwenang data
mastrer user. Centrally disimpan berarti catatan data selalu konsisten,
up-to-date dan bebas redudansi. master data juga memiliki aspek organisasi
karena informasi adalah disusun dalam pandangan yang ditugaskan untuk elemen
organisasi.
35. Apa Sifat Master Data
Master data juga memiliki aspek
organisasi karena informasi yang diatur dalam pandangan yang ditugaskan untuk
elemen organisasi.Mengintegrasikan data yang sesuai ke dalam satu objek
database tunggal berarti bahwa masalah redundansi data tidak masalah dan
integritas data ditingkatkan.
36. Apa saja data yang disimpan di Master Data
penjualan, pembelian, manajemen
persediaan, bahan perencanaan, verifikasi tagihan, keuangan, dan sumber daya
manusia.
37. Jelaskan tiga struktur dalam customer master
1. General Data: Data ini juga relevan untuk setiap kode
perusahaan dan setiap organisasi penjualan dalam perusahaan
2. Data for Company Codes: Data ini
mencerminkan perjanjian khusus perusahaan dengan pelanggan.
3. Data for Sales : Data ini memiliki
karakteristik yang berbeda untuk organisasi dan saluran penjualan perusahaan.
38. Fungsi-fungsi distributed database :
- Memiliki sistem katalog untuk
menyimpan kumpulan detail data yang telah
didstribusikan.
- Memberikan pelayanan komunikasi
untuk memberikan akses komputer yang terhubung baik yang jarak dekat
maupun yang letak cukup jauh dan mengijinkan pencarian data komputer yg
terhubung.
- Memberikan pelayanan recoveri
untuk mengambil laporan yang rusak dari tiap komputer dan kegagalan dalam
hubungan komunikasi
- Mendistribusikan proses pencarian
termasuk optimasisasi dan pengaksesan dari jarak jauh.
- Memberikan pengendalian keamanan
untuk akses ataupun otoritas yang telah diberikan .
- Memberikan kontrol untuk memelihara
data yg telah di copykan.
39. Kelebihan dan Kekurangan
Dustributed database
Kelebihan
distributed database
- Kinerja yang lebih baik karena data
ditempatkan di tempat yang sesuai dengan kebutuhan dan komputer-komputer
dalam sistem dapat bekerja secara paralel, sehingga pembebanan pada
komputer (server) menjadi seimbang.
- Lebih ekonomis, sistem yang terdiri atas
jaringan komputer-komputer kecil (sederhana) dibandingkan dengan
mengimplementasikan komputer tunggal yang canggih.
- Sistem-sistem yang bekerja dalam basis
data terdistribusi dapat dimodifikasi, ditambah, atau dikurangi tanpa
memengaruhi modul lain (sistem lain dalam basis data terdistribusi).
Dengan pembagian lokasi data, jika terjadi masalah atau musibah pada
sistem, tidak semua data terancam, melainkan hanya data pada tempat-tempat
tertentu.
- Dengan basis data terdistribusi,
data-data perusahaan dapat disebar ke tiap-tiap departemen yang
bertanggung jawab atasnya.
Kekurangan distributed database
- Administrator basis data mempunyai tugas ekstra untuk
menjaga agar basis data yang tersebar di berbagai lokasi terlihat
transparan. Pemeliharaan sistem-sistem yang berlainan lebih kompleks
ketimbang pemeliharaan sistem besar yang utuh sebagai satu kesatuan
sehimgga dapat menyebabkan pembengkakan biaya.
- Desain yang dibuat harus memperhatikan arsitektur komputer
yang terdiri atas sistem-sistem yang terpisah, selain itu juga
memperhatikan data yang difragmentasi (dipecah-pecah) ke dalam lokasi
berlainan. Perubahan dari basis data terpusat menjadi terdistribusi juga
menjadi masalah karena belum ada standar metodologi.
- Keamanan data, yaitu bukan hanya satu sistem yang harus
diberi proteksi keamanan data, melainkan juga fragmen-fragmennya yang
tersebar di berbagai lokasi, juga jalur komunikasi antarsistem.
- Kendala mempertahankan integritas karena dalam menjaga
integritas sistem melalui jaringan juga dapat memakan resource yang besar
dari jaringan.
40. Ada beberapa alasan mengapa data harus
didistribusikan :
- Data didistribusikan untuk meminimalisasikan biaya
komunikasi ataupun waktu respon
- Data dapat tersimpan dalam suatu tempat dimana data
tersebut diciptakan sehingga pencipta data dapat melakukan kontrol
keamanan data
- Data dapat direplikasikan untuk meningkatkan
ketersediaan pada suatu event kesalahan ataupun untuk mengurangi waktu
respon
41. Alasan mengapa tabel-tabel pada database
haruslah didistribusikan pada beberapa komputer yang terhubung ke jaringan
adalah adanya dua alasan :
- Secara signifikan meningkatkan performansi, performansi
meningkat disebabkan karena penempatan data yang frekuensi aksesnya paling
tinggi dekat dengan sisi client
- Karena peningkatan suatu sistem, dalam artian bahwa suatu
bisnis akan semakin berkembang melebihi kapasitas aslinya sehingga
diperlukan multisistem untuk mengolah database ini
42. Pengertian Database Link
Database link merupakan sebuah pointer
yang didefinisikan sebagai satu-arah jalur komunikasi dari server Oracle
Database kepada server database lainnya. Pointer link sebenarnya dimaksudkan
sebagai suatu entry (masukkan) pada tabel data dictionary. Untuk mengakses link
tersebut, kita harus terhubung pada database lokal yang terdiri dari entry data
dictionary.
43. Oracle Database menggunakan global database
name untuk menamakan schema obyek secara global dengan kalimat sebagai berikut
:
schema.schema_object@global_database_name
dimana :
- schema adalah koleksi dari logika struktur-struktur data
atau schema obyek. Sebuah skema masing dimiliki satu user database dan
mempunyai nama yang sama dengan user. Masing-masing user mempunya satu
skema.
- schema_object adalah logika struktur data seperti sebuah
tabel, index, view, synonym, procedure, package, atau database link.
- Global_database_name adalah nama dari database remote.
Nama ini harus sama dengan rentetan parameter DB_NAME dan DB_DOMAIN,
kecuali parameter GLOBAL_NAMES diset menjadi FALSE.
44. Database Terdistribusi adalah
atabase terdistribusi adalah sebuah
database yang diatur oleh sebuah Database Management System (DBMS) yang
tersimpan secara fisik pada beberapa komputer yang terdapat pada beberapa
lokasi dengan terkoneksi pada sebuah jaringan . jaringan tersebut harus bisa
menyediakan akses bagi user untuk melakukan sharing data. Terdapat dua macam
sifat dari database terdistribusi yaitu Heterogenous dan Homogenous. Homogenous
artinya suatu database terdistribusi dimana data di distribusikan pada beberapa
komputer dengan menggunakan DBMS(database management system) yang sama. DBMS
digunakan pada database terdistribusi untuk melakukan koordinasi data pada
beberapa node. Sedangkan Heterogenous adalah kebalikan dari Homogenous dimana
data di sebarkan dengan menggunakan DBMS yang berbeda.
45. Karakteristik database terdistribusi yaitu :
- Kumpulan data yang digunakan bersama secara logic
tersebar pada sejumlah computer yang berbeda
- Komputer yang dihubungkan menggunakan jaringan
komunikasi.
- Data pada masing-masing situs dapat menangani
aplikasi-aplikasi local secara otonom.
- Data pada masing situs di bawah kendali satu DBMS.
- Masing-masing DBMS berpartisipasi dalam sedikitnya satu
aplikasi global.
46. Bentuk-bentuk Topologi Distribusi Data :
a. Fully Connected Network
Kalau salah satu node rusak, yang lainnya
masih dapat berjalan (biaya mahal), control
manajemen tidak terjamin.
b. Partialy Connected Network
Reliability rendah, biaya dapat ditekan
Kontrol manajemen tidak terjamin.
c. Tree Structured Network
Bersifat sentral, control manajemen lebih
terjamin
Kalau node pusat rusak, semua akan rusak.
(setiap proses dimulai dari bawah).
d. Ring Network
Rusak satu, yang lain masih berjalan
Kontrol manajemen kurang terjamin karena
bersifat dsesentralisasi.
e. Star Network
Rusak satu, yang lain masih berjalan
Kontrol manajemen kurang terjamin karena
bersifat dsesentralisasi.
47. Pengguna mengakses basis data terdistribusi
dengan menggunakan dua aplikasi yaitu aplikasi lokal dan aplikasi global,
sehingga DDBMS memiliki karakteristik yaitu :
- Kumpulan dari data logik yang digunakan bersama-sama
- Data di bagi menjadi beberapa fragment
- Fragment mungkin mempunyai copy ( replika )
- Fragment / replika nya di alokasikan pada yang digunakan
- Setiap site berhubungan dengan jaringan komunikasi
- Data pada masing-masing site dibawah pengawasan DBMS
- DBMS pada masing-masing site dapat mengatasi aplikasi
lokal, secara otonomi
- Masing-masing DBMS berpastisipasi paling tidak satu
global aplikasi.
48. Adapun salah satu cara untuk
mendistribusikan database adalah dengan replikasi.
Ada 5
keuntungan dari replikasi data yaitu :
- Reliability jika sebuah sistem yang menyimpan suatu
database mengalami kerusakan maka sistem lain dapat menemukan kopi dari
database yang di maksud pada node yang lain yang tidak mengalami kerusakan
system karena database di simpan pada beberapa node.
- Fast response setiap situs mempunyai kopi dari database
sehingga proses query data dapat berjalan lebih cepat.
- Node decoupling setiap transaksi data bisa di proses
tanpa koordinasi antar jaringan sehingga jika sebuah node sibuk atau
mengalami kesalahan maka akan ada sistem tersendiri yang menangani
koordinas antar data.
- Reduced network trafic at prime time kemampuan sistem
untuk memindahkan transaksi database pada jaringan yang sedang tidak sibuk
atau berfungsi dengan tidak sebagaimana mestinya.
49. Terdapat dua macam sifat dari database
terdistribusi yaitu Heterogenous dan Homogenous.
- Homogenous artinya suatu database terdistribusi dimana
data di distribusikan pada beberapa komputer dengan menggunakan
DBMS(database management system) yang sama. DBMS digunakan pada database
terdistribusi untuk melakukan koordinasi data pada beberapa node.
- Heterogenous adalah kebalikan dari Homogenous dimana
data di sebarkan dengan menggunakan DBMS yang berbeda.
Tujuan utama dari database
terdistribusi menyediakan kemudahan untuk mengakses data bagi user pada banyak
lokasi yang berjauhan. Untuk mencapai tujuan ini system dari database
terdistribusi harus menyediakan apa yang di sebut location transparency yang
artinya seorang user dalam mengakses data tidak akan terbatas pada tempat, di
manapun dia berada user dapat mengakases data.
50. Fragmentasi Pada Distributed Database
Fragmentasi adalah pemisahan entitas –
entitas dalam basis data. Fragmentasi terdiri dari relasi yang dibagi ke relasi
atau fragmen yang lebih kecil dan mengirim fragmen pada beberapa tempat.
Terdapat empat macam fragmentasi, fragmentasi horizontal, fragmentasi vertikal,
fragmentasi hybrid dan fragmentasi derived. Pada fragmentasi horisontal, setiap
fragmen terdiri dari sebuah subset baris dari relasi asal. Pada fragmentasi
vertikal, setiap fragment terdiri dari sebuah subset kolom dari relasi asal.
Fragmentasi hybrid merupakan gabungan keduanya.
No comments:
Post a Comment