Normalisasi


Pokok Bahasan : 

  • Anomali 
  • Redudansi
  • Normalisasi
  • Tabel Universal
  • Functional Dependency
  • Bentuk Normal Form
  • Studi Kasus Normalisasi Data

Anomali

Anomali adalah suatu masalah yang timbul pada Tabel data, dimana masalah itu akan terjadi pada saat Tabel data akan dimanipulasi. Hal-hal yang biasa terjadi ialah ketidak konsistenan data atau data menjadi hilang ketika data lainnya dihapus.

Bentuk Anomali : 

  • Anomali Penambahan  / Insert
  • Anomali Perubahan     / Update
  • Anomali Penghapusan / Delete

Anomali Penambahan/ Insert Anomaly

      Anomali Penambahan terjadi pada saat penambahan data hendak dilakukan ternyata ada elemen data yang masih kosong dan elemen data tersebut diperlukan untuk proses penambahan.


Anomali Pengubahan/ Update Anomaly

      Anomali pengubahan terjadi apabila pengubahan pada sejumlah data yang duplikasi tetapi tidak seluruhnya diubah.

Anomali Penghapusan/ Delete Anomaly

      Anomali Penghapusan terjadi apabila ada suatu tupel yang tidak terpakai dihapus mengakibatkan adanya data lain yang hilang.

Redudansi/ Redudancy 

Munculnya data yang berulang kali pada suatu tabel/relasi yang semestinya tidak diperlukan. Kerangkapan data dapat terjadi :
  • Kerangkapan data dalam satu file.
  • Kerangkapan data dalam beberapa file.

Normalisasi

      Normalisasi merupakan sebuah teknik dalam logical desain sebuah basis data yang mengelompokkan atribut dari suatu relasi sehingga membentuk struktur relasi yang baik (tanpa redudansi).  Normalisasi adalah proses pembentukan struktur basis data sehingga sebagian besar ambiguity bisa dihilangkan.

Tujuan Dari  dilakukannya normalisasi ialah untuk : 
  • Untuk menghilang kerangkapan data 
  • Untuk mengurangi kompleksitas 
  • Untuk mempermudah pemodifikasian data
Proses Normalisasi :
  • Data diuraikan dalam bentuk tabel, selanjutnya dianalisis berdasarkan persyaratan tertentu ke beberapa tingkat. 
  • Apabila tabel yang diuji belum memenuhi persyaratan tertentu, maka tabel tersebut perlu dipecah menjadi beberapa tabel yang lebih sederhana sampai memenuhi bentuk yang optimal.

Tahapan Normalisasi : 

  • Tahap Normalisasi dimulai dari tahap paling ringan (1NF) hingga paling ketat (5NF).
  • Biasanya hanya sampai pada tingkat 3NF atau BCNF karena sudah cukup memadai untuk menghasilkan tabel-tabel yang berkualitas baik.
  • Urutan : 1NF - 2NF - 3NF - BCNF - 4NF - 5NF

Sebuah tabel dikatakan baik (efisien) jika memenuhi 3 kriteria sebagai berikut :

  1. Jika ada dekomposisi (penguraian) tabel, maka dekomposisinya  harus dijamin aman (Lossless-Join Decomposition). Artinya, setelah tabel tersebut diuraikan / didekomposisi menjadi tabel-tabel baru, tabel-tabel baru tersebut bisa menghasilkan tabel semula dengan sama persis. 
  2. Terpeliharanya ketergantungan fungsional pada saat perubahan data (Dependency Preservation). 
  3. Tidak melanggar Boyce-Codd Normal Form (BCNF)
Tambahan : Jika kriteria ketiga (BCNF) tidak dapat terpenuhi, maka paling tidak tabel tersebut tidak melanggar Bentuk Normal  tahap ketiga (3rd Normal Form / 3NF).


Tabel Universal/ Star Table

Tabel Universal adalah sebuah tabel yang merangkum semua kelompok data yang saling berhubungan, bukan merupakan tabel yang baik.

Functional Dependency

  • Notasi: A → B                                                    
A dan B adalah atribut dari sebuah tabel. Berarti secara fungsional A menentukan B atau B tergantung pada A, jika dan hanya jika ada 2 baris data dengan nilai A yang sama, maka nilai B juga sama.
  • Notasi: A ⇏ B atau A x→ B adalah kebalikan dari notasi sebelumnya.
Functional Dependency dari tabel nilai :
  • Nrp → namaMhs 
Karena untuk setiap nilai nrp yang sama, maka nilai namaMhs juga sama.

  •  {Namakul,  nrp} → NiHuruf 
Karena attribut Nihuruf tergantung pada Namakul dan nrp secara bersama-sama. Dalam arti lain untuk Namakul dan nrp yang sama, maka NiHuruf juga sama, karena Namakul dan nrp merupakan key (bersifat unik).

  • NamaKul ⇏ nrp dan Nrp ⇏ NiHuruf 

Contoh FD 1 : Andaikan ada tabel : 
  • NILAI (NIM, Nm-mk, Semester, Nilai) 
  • Atribut kunci: NIM, Nm-mk, Semester 
  • Maka Functional Dependency: NIM, Nm-mk, Semester -> Nilai

Bentuk - bentuk Normal Form : 

  1. Bentuk Normal Tahap Pertama (1st Normal Form / 1NF) 
  2. Bentuk Normal Tahap Kedua (2nd Normal Form / 2NF) 
  3. Bentuk Normal Tahap (3rd Normal Form / 3NF) 
  4. Boyce-Code Normal Form (BCNF) 
  5. Bentuk Normal Tahap (4th Normal Form / 4NF) 
  6. Bentuk Normal Tahap (5th Normal Form / 5NF)

1. Normal Pertama (1st Normal Form)

  • Tidak adanya atribut multi-value, atribut komposit atau kombinasinya. 
  • Mendefinisikan atribut kunci. 
  • Setiap atribut dalam tabel tersebut harus bernilai atomic (tidak dapat dibagi-bagi lagi)
Contoh : (Atribut Multivalue)


2. Normalisasi Kedua (2nd Normal Form)

  • Sudah memenuhi dalam bentuk normal kesatu (1NF) 
  • Semua atribut bukan kunci hanya boleh tergantung (functional dependency) pada atribut kunci 
  • Jika ada ketergantungan  parsial maka atribut tersebut harus dipisah pada tabel yang lain 
  • Perlu ada tabel penghubung ataupun kehadiran foreign key bagi atribut-atribut yang telah dipisah tadi
Contoh : 

Tabel berikut memenuhi 1NF tapi tidak termasuk 2NF :
 

Tidak memenuhi 2NF, karena {Mhs_nrp, mk_kode} yang dianggap sebagai primary key sedangkan: 

      • {Mhs_nrp, mk_kode} ⇏ mhs_nama 
      • {Mhs_nrp, mk_kode} ⇏ mhs_alamat 
      • {Mhs_nrp, mk_kode} ⇏ mk_nama 
      • {Mhs_nrp, mk_kode} ⇏ mk_sks 
      • {Mhs_nrp, mk_kode} ⇏ nihuruf 
Tabel di atas perlu didekomposisi menjadi beberapa tabel yang memenuhi syarat 2NFFunctional dependencynya sbb:
  • {Mhs_nrp, mk_kode} →  nihuruf                                    (fd1)
  • Mhs_nrp             → {mhs_nama, mhs_alamat}     (fd2) 
  • Mk_kode             → {mk_nama, mk_sks}             (fd3) 

  • fd1 (mhs_nrp, mk_kode, nihuruf)          → Tabel Nilai 
  • fd2 (Mhs_nrp, mhs_nama, mhs_alamat)  → Tabel Mahasiswa 
  • fd3 (mk_kode, mk_nama, mk_sks)                   → Tabel MataKuliah


3. Normalisasi Ketiga (3rd Normal Form)

  • Sudah berada dalam bentuk normal kedua (2NF) 
  • Tidak ada ketergantungan transitif (dimana atribut bukan kunci tergantung pada atribut bukan kunci lainnya).
Contoh : 

Mahasiswa

karena masih terdapat atribut non primary key (yakni alm_kota dan alm_Provinsi) yang memiliki ketergantungan terhadap atribut non primary key yang lain (yakni alm_kodepos) :

alm_kodepos → {alm_Provinsi, alm_kota} 

Sehingga tabel tersebut perlu didekomposisi menjadi: 

Mahasiswa (Nrp, nama, alm_jalan, alm_kodepos) Kodepos (alm_kodepos, alm_provinsi, alm_kota) 

Tambahan : Tabel-tabel yang memenuhi kriteria normalisasi ketiga, sudah siap diimplementasikan. Sebenarnya masih ada lagi bentuk normalisasi yang lain; Normalisasi Boyce-Codd, 4NF, 5NF, hanya saja jarang dipakai. Pada kebanyakan kasus, normalisasi hanya sampai ketiga. 

4. Boyce-Codd Normal Form (BCNF)

  • Bentuk BCNF terpenuhi dalam sebuah tabel, jika untuk setiap functional dependency terhadap setiap atribut atau gabungan atribut dalam bentuk : X  Y maka X adalah super key .
  • Tabel tersebut harus di-dekomposisi berdasarkan functional dependency yang ada, sehingga X menjadi super key dari tabel-tabel hasil dekomposisi .
  • Setiap tabel dalam BCNF merupakan 3NF. Akan tetapi setiap 3NF belum tentu termasuk BCNF . Perbedaannya, untuk functional dependency X  A, BCNF tidak membolehkan A sebagai bagian dari primary key.

5. Bentuk Normal Tahap Keempat (4th Normal Form /4NF)

  • Bentuk normal 4NF terpenuhi dalam sebuah tabel jika telah memenuhi bentuk BCNF, dan tabel tersebut tidak boleh memiliki lebih dari sebuah multivalued atribute 
  • Untuk setiap multivalued dependencies (MVD) juga harus merupakan functional dependencies
Contoh : 

 


6. Bentuk Normal Tahap Kelima (5th Normal Form /5NF)

  • Bentuk normal 5NF terpenuhi jika tidak dapat memiliki sebuah lossless decomposition menjadi tabel-tabel yg lebih kecil. 
  • Jika 4 bentuk normal sebelumnya dibentuk berdasarkan functional dependency, 5NF dibentuk berdasarkan konsep join dependence. Yakni apabila sebuah tabel telah di-dekomposisi menjadi tabel-tabel lebih kecil, harus bisa digabungkan lagi (join) untuk membentuk tabel semula.

Studi Kasus Normalisasi Data


Untuk mendapatkan hasil yang paling normal, maka proses normalisasi dimulai dari normal pertama. Field-field tabel di atas yang merupakan group berulang : NoPegawai, NamaPegawai, Golongan, BesarGaji.

1. Normalisasi Pertama

Solusinya hilangkan duplikasi dengan mencari ketergantungan parsial. menjadikan field-field menjadi tergantung pada satu atau beberapa field. Karena yang dapat dijadikan kunci adalah NoProyek dan NoPegawai, maka langkah kemudian dicari field-field mana yang tergantung pada NoProyek dan mana yang tergantung pada NoPegawai.

2. Normalisasi Kedua

Field-field yang tergantung pada satu field haruslah dipisah dengan tepat, misalnya NoProyek menjelaskan NamaProyek dan NoPegawai menjelaskan NamaPegawai, Golongan dan BesarGaji. 


Untuk membuat hubungan antara dua tabel, dibuat suatu tabel yang berisi key-key dari tabel yang lain. 

3. Normalisasi Ketiga

Pada tabel diatas masih terdapat masalah, bahwa BesarGaji  tergantung kepada Golongan nya. Padahal disini Golongan bukan merupakan field kunci. Artinya kita harus memisahkan field non-kunci Golongan dan BesarGaji yang tadinya tergantung secara parsial kepada field kunci NoPegawai, untuk menghilangkan ketergantungan transitif.

Saya rasa cukup sekian, Semoga bermanfaat >W<



Komentar

Postingan populer dari blog ini

Analisis dan Perancangan Data

Transformasi