RANCANGAN DISTRIBUSI BASIS DATA
1.
ALOKASI DATA
Dalam basis data terdistribusi,
alokasi mengacu kepada distribusi data ke tempat yang optimal. Ada tiga aspek
dalam memastikan alokasi menjadi optimal, antara lain
* biaya minimal, yang mencakup aspek
komunikasi, penyimpanan, dan pemrosesan (pembacaan dan update); biaya mengacu
pada waktu dan biaya jaringan
* kinerja, yang mencakup waktu
respons dan throughput
* konstrain pemrosesan dan
penyimpanan per situs (tempat menyimpan data)
Alokasi – Kebutuhan Informasi
Untuk dapat mengalokasikan basis data
terdistribusi secara optimal, dibutuhkan informasi-informasi tentang sistem
sebagai berikut:
* informasi basis data
o skema konseptual basis data dan
jumlah situs tersedia
o jumlah, ukuran, dan selektivitas
fragmen per relasi global
* informasi aplikasi
o jumlah query aplikasi
o rata-rata jumlah akses baca
dariquery ke dalam sebuah fragmen
o rata-rata jumlah akses update dari
query ke dalam sebuah fragmen
o matriks yang menunjukkan query mana
yang meng-update dan/atau membaca fragmen tertentu
o situs asal tiap-tiap query
dijalankan
* informasi situs
o unit cost penyimpanan data dalam
satu situs
o unit cost pemrosesan data dalam
satu situs
* informasi jaringan
o komunikasi antara dua situs,
mencakup antara lain bandwidth dan tunda (latency)
2.
FRAGMENTASI DATA
Fragmentasi : relasi dipartisikan ke
dalam beberapa bagian, setiap bagian disimpan pada lokasi yang berbeda.
Jenis-Jenis Fragmentasi Data
1. Fragmentasi Horizontal.
Fragmentasi horizontal berisikan
tuple-tuple yang dipartisi dari sebuah relasi global ke dalam sejumlah subset
r1, r2, ... , rn.
2. Fragmentasi Vertikal
Fragmentasi vertikal disempurnakan
dengan menambahkan sebuah atribut yang disebut tuple identifier (tuple-id) ke
dalam skema r.
3. Fragmentasi Campuran
Relasi r (global) dibagi-bagi ke
dalam sejumlah relasi fragment r1, r2, r3, ..., rn. Tiap-tiap fragment
diperoleh sebagai hasil baik dari skema fragmentasi horizontal ataupun skema
fragmentasi vertikal pada relasi r, atau dari sebuah fragment r yang diperoleh
sebelumnya.
3. REPLIKASI
Sistem basis data terdistribusi dapat
menyimpan duplikat dari data yang sama dalam site yang berbeda agar perolehan
informasi yang semakin cepat dan toleransi kesalahan. Proses ini disebut
replikasi. Replikasi pada relasi bersifat redundan pada dua atau lebih situs.
Replikasi pada relasi disebut
replikasi penuh bila relasi tersebut disimpan pada semua situs. Basis data
disebut redundan penuh jika tiap-tiap site mengandung duplikat dari keseluruhan
basis data.
Replikasi dilakukan karena memiliki
kelebihan sebagai berikut:
* jika situs asli yang menyimpan
relasi R mengalami kegagalan, relasi R tetap dapat diakses melalui replikanya
* query pada relasi R dapat berjalan
secara paralel di simpul (situs) yang berbeda
* lebih sedikit transfer data, yaitu
tidak perlu lagi mengambil data suatu relasi melalui jaringan karena sudah ada
replika dalam situs lokal.
Namun, proses replikasi juga memiliki
kelemahan, antara lain
* proses update yang lebih rumit
karena setiap replika relasi R harus di-update.
* kendali atas konkurensi yang lebih
rumit karena update terhadap replika secara konkuren dapat menyebabkan basis
data menjadi tidak konsisten sehingga diperlukan mekanisme khusus dalam
penanganan konkurensi.
Sementara itu, dalam melakukan
replikasi, ada dua strategi, yaitu
* sinkron: sebelum seluruh proses
transaksi update dinyatakan selesai, data yang telah dimodifikasi disinkronkan
ke setiap duplikatnya; proses ini harus menunggu hingga data di tempat
penyimpanan duplikat selesai ditulis sebelum dilakukan perubahan lainnya
sehingga menjadi lebih kompleks
* asinkron: copy data diperbaharui
secara periodik berdasarkan data utama yang diperbaharui; proses penulisan data
selesai tanpa perlu menunggu penulisan data di tempat penyimpanan duplikat
selesai; proses ini memang meningkatkan kinerja sistem namun risikonya,
inkonsistensi data bisa terjadi.
Tidak ada komentar:
Posting Komentar