Kamis, 13 Juni 2013

RANCANGAN DISTRIBUSI BASIS DATA

RANCANGAN DISTRIBUSI  BASIS DATA

1.      ALOKASI DATA
Dalam basis data terdistribusi, alokasi mengacu kepada distribusi data ke tempat yang optimal. Ada tiga aspek dalam memastikan alokasi menjadi optimal, antara lain

* biaya minimal, yang mencakup aspek komunikasi, penyimpanan, dan pemrosesan (pembacaan dan update); biaya mengacu pada waktu dan biaya jaringan
* kinerja, yang mencakup waktu respons dan throughput
* konstrain pemrosesan dan penyimpanan per situs (tempat menyimpan data)

Alokasi – Kebutuhan Informasi

Untuk dapat mengalokasikan basis data terdistribusi secara optimal, dibutuhkan informasi-informasi tentang sistem sebagai berikut:

* informasi basis data
o skema konseptual basis data dan jumlah situs tersedia
o jumlah, ukuran, dan selektivitas fragmen per relasi global
* informasi aplikasi
o jumlah query aplikasi
o rata-rata jumlah akses baca dariquery ke dalam sebuah fragmen
o rata-rata jumlah akses update dari query ke dalam sebuah fragmen
o matriks yang menunjukkan query mana yang meng-update dan/atau membaca fragmen tertentu
o situs asal tiap-tiap query dijalankan
* informasi situs
o unit cost penyimpanan data dalam satu situs
o unit cost pemrosesan data dalam satu situs
* informasi jaringan
o komunikasi antara dua situs, mencakup antara lain bandwidth dan tunda (latency)

2.      FRAGMENTASI DATA
Fragmentasi : relasi dipartisikan ke dalam beberapa bagian, setiap bagian disimpan pada lokasi yang berbeda.
Jenis-Jenis Fragmentasi Data
1. Fragmentasi Horizontal.
Fragmentasi horizontal berisikan tuple-tuple yang dipartisi dari sebuah relasi global ke dalam sejumlah subset r1, r2, ... , rn.
2. Fragmentasi Vertikal
Fragmentasi vertikal disempurnakan dengan menambahkan sebuah atribut yang disebut tuple identifier (tuple-id) ke dalam skema r.
3. Fragmentasi Campuran
Relasi r (global) dibagi-bagi ke dalam sejumlah relasi fragment r1, r2, r3, ..., rn. Tiap-tiap fragment diperoleh sebagai hasil baik dari skema fragmentasi horizontal ataupun skema fragmentasi vertikal pada relasi r, atau dari sebuah fragment r yang diperoleh sebelumnya.

3. REPLIKASI
Sistem basis data terdistribusi dapat menyimpan duplikat dari data yang sama dalam site yang berbeda agar perolehan informasi yang semakin cepat dan toleransi kesalahan. Proses ini disebut replikasi. Replikasi pada relasi bersifat redundan pada dua atau lebih situs.

Replikasi pada relasi disebut replikasi penuh bila relasi tersebut disimpan pada semua situs. Basis data disebut redundan penuh jika tiap-tiap site mengandung duplikat dari keseluruhan basis data.

Replikasi dilakukan karena memiliki kelebihan sebagai berikut:

* jika situs asli yang menyimpan relasi R mengalami kegagalan, relasi R tetap dapat diakses melalui replikanya
* query pada relasi R dapat berjalan secara paralel di simpul (situs) yang berbeda
* lebih sedikit transfer data, yaitu tidak perlu lagi mengambil data suatu relasi melalui jaringan karena sudah ada replika dalam situs lokal.

Namun, proses replikasi juga memiliki kelemahan, antara lain

* proses update yang lebih rumit karena setiap replika relasi R harus di-update.
* kendali atas konkurensi yang lebih rumit karena update terhadap replika secara konkuren dapat menyebabkan basis data menjadi tidak konsisten sehingga diperlukan mekanisme khusus dalam penanganan konkurensi.

Sementara itu, dalam melakukan replikasi, ada dua strategi, yaitu

* sinkron: sebelum seluruh proses transaksi update dinyatakan selesai, data yang telah dimodifikasi disinkronkan ke setiap duplikatnya; proses ini harus menunggu hingga data di tempat penyimpanan duplikat selesai ditulis sebelum dilakukan perubahan lainnya sehingga menjadi lebih kompleks

* asinkron: copy data diperbaharui secara periodik berdasarkan data utama yang diperbaharui; proses penulisan data selesai tanpa perlu menunggu penulisan data di tempat penyimpanan duplikat selesai; proses ini memang meningkatkan kinerja sistem namun risikonya, inkonsistensi data bisa terjadi.

Tidak ada komentar:

Posting Komentar