
Langkah-langkah penyelesaian kasus pada table diatas adalah:
1. Menghitung jumlah kasus, jumlah kasus untuk keputusan Yes, jumlah kasus untuk keputusan No, dan Entropy dari semua kasus dan kasus yang dibagi berdasarkan atribut OUTLOOK, TEMPERATUR, HUMIDITY, dan WINDY.
2. Lakukan perhitungan Gain untuk setiap Hasil perhitungan .
Rumus Entrophy

Rumus Gain

Keterangan :
S : himpunan kasus
A : atribut
N : jumlah partisi atribut A
[Si] : jumlah kasus pada partisi ke-i
[S] : jumlah kasus pada S
Baris total kolom Entropy pada table dihitung dengan persamaan berikut:

Nilai Gain pada baris OUTLOOK dihitung dengan persamaan berikut:

Maka jika dibuat dalam bentuk tabel hasilnya seperti ini:
>
Dari tabel diatas dapat diketahui bahwa atribut dengan Gain tertinggi adalah HUMADITY, yaitu sebesar 0.37. Jadi HUMADITY yang menjadi node akar. Ada dua nilai atribut dari HUMADITY, yaitu HIGH dan NORMAL. Dari kedua atribut, nilai atribut NORMAL adalah 1, yaitu keputusan Yes, sehingga tidak perlu perhitungan lebih lanjut, tetapi untuk HIGH masih perlu dilakukan perhitungan lagi.
Maka dapat digambarkan pohon keputusan seperti berikut:

Menghitung jumlah kasus, jumlah kasus untuk keputusan Yes, jumlah kasus untuk keputusan No, dan Entropy dari semua kasus dan kasus yang dibagi berdasarkan atribut OUTLOOK, TEMPERATURE, dan WINDY yang dapat menjadi node akar dari nilai atribut HIGH. Kemudian lakukan perhitungan Gain untuk tiap-tiap atribut.
Kemudian lakukan perhitungan Gain untuk tiap-tiap atribut. Hasil perhitungan seperti yang terdapat pada tabel dibawah ini:
Dari hasil tabel diatas dapat diketahui bahwa atribut dengan Gain tertinggi adalah OUTLOOK, yaitu sebesar 0.7. Jadi OUTLOOK dapat menjadi node cabang dari nilai atribut HIGH. Ada tiga nilai atribut dati OUTLOOK, yaitu CLOUDY, RAINY dan SUNNY. Dari ketiga nilai atribut tersebut, nilai atribut CLOUDY adalah 1, yaitu keputusannya Yes dan nilai atribut SUNNY menjadi keputusan No, sehingga tidak perlu dilakukan perhitungan lebih lanjut, tetapi nilai atribut RAINY masih perlu dilakukan perhitungan lagi.
Pohon keputusan yang terbentuk sampai tahap ini adalah terlihat pada gambar berikut.

Menghitung jumlah kasus, jumlah kasus untuk keputusan Yes, jumlah kasus untuk keputusan No, dan Entropy dari semua kasus dan kasus yang dibagi berdasarkan atribut TEMPERATURE dan WINDY yang dapat menjadi node cabang dari nilai atribut RAINY. Kemudian lakukan perhitungan Gain untuk tiap-tiap atribut. Hasil perhitungan seperti yang terdapat pada tabel berikut:
Dari hasil tabel
dapat diketahui bahwa atribut dengan Gain tertinggi adalah WINDY, yaitu sebesar 1. Jadi WINDY dapat menjadi node cabang dari nilai atribut RAINY. Ada dua nilai atribut dari WINDY, yaitu FALSE dan TRUE. Dari kedua nilai atribut tersebut, nilai atribut FALSE adalah 1, yaitu keputusannya Yes dan nilai atribut TRUE menjadi keputusan No, sehingga tidak perlu dilakukan perhitungan lebih lanjut untuk nilai atribut ini. Pohon keputusan yang terbentuk sampai tahap ini adalah terlihat pada gambar berikut:

Gambar diatas merupakan gambar akhir dari proses Data Mining menggunakan algoritma C4.5 pada contoh kasus keputusan bermain tenis. Berdasarkan gambar di atas dapat ditarik kesimpulan bahwa jika humadity normal maka keputusannya adalah yes, jika humadity adalah high, outlook adalah cloudy maka keputusannya adalah bermain (yes), selanjutnya jika humadity adalah high, outlook adalah rainy dan windy adalah true, maka keputusannya adalah bermain (yes). Dan jika humadity adalah high, outlook adalah rainy dan windy adalah false, maka keputusannya adalah tidak bermain (no). Terakhit jika humadity adalah high, outlook adalah no, maka keputusannya adalah tidak bermain (no).
Tidak ada komentar:
Posting Komentar