Senin, 11 Mei 2020

Latihan Pohon Keputusan

Data Tabel Keputusan untuk “Play Tennis”

table

 Langkah-langkah penyelesaian kasus pada table diatas adalah:

1. Menghitung jumlah kasus, jumlah kasus untuk keputusan Yes, jumlah kasus untuk keputusan No, dan Entropy dari semua kasus dan kasus yang dibagi berdasarkan atribut OUTLOOK, TEMPERATUR, HUMIDITY, dan WINDY.
2. Lakukan perhitungan Gain untuk setiap Hasil perhitungan .

Rumus Entrophy

rumus2

Rumus Gain

rumus
Keterangan :

S          : himpunan kasus

A         : atribut

N         : jumlah partisi atribut A

[Si]       : jumlah kasus pada partisi ke-i

[S]        : jumlah kasus pada S

Baris total kolom Entropy pada table  dihitung dengan persamaan berikut:

hitung entropy

Nilai Gain pada baris OUTLOOK dihitung dengan persamaan berikut:

outlook

Maka jika dibuat dalam bentuk tabel hasilnya seperti ini:

>

Dari tabel diatas  dapat diketahui bahwa atribut dengan Gain tertinggi adalah HUMADITY, yaitu sebesar 0.37. Jadi HUMADITY yang menjadi node akar. Ada dua nilai atribut dari HUMADITY, yaitu HIGH dan NORMAL. Dari kedua atribut, nilai atribut NORMAL adalah 1, yaitu keputusan Yes, sehingga tidak perlu perhitungan lebih lanjut, tetapi untuk HIGH masih perlu dilakukan perhitungan lagi.

Maka dapat digambarkan pohon keputusan seperti berikut:

pohon1

Menghitung jumlah kasus, jumlah kasus untuk keputusan Yes, jumlah kasus untuk keputusan No, dan Entropy dari semua kasus dan kasus yang dibagi berdasarkan atribut OUTLOOK, TEMPERATURE, dan WINDY yang dapat menjadi node akar dari nilai atribut HIGH. Kemudian lakukan perhitungan Gain untuk tiap-tiap atribut.

Kemudian lakukan perhitungan Gain untuk tiap-tiap atribut. Hasil perhitungan seperti yang terdapat pada tabel dibawah ini:



Dari hasil tabel diatas dapat diketahui bahwa atribut dengan Gain tertinggi adalah OUTLOOK, yaitu sebesar 0.7. Jadi OUTLOOK dapat menjadi node cabang dari nilai atribut HIGH. Ada tiga nilai atribut dati OUTLOOK, yaitu CLOUDY, RAINY dan SUNNY. Dari ketiga nilai atribut tersebut, nilai atribut CLOUDY adalah 1, yaitu keputusannya Yes dan nilai atribut SUNNY menjadi keputusan No, sehingga tidak perlu dilakukan perhitungan lebih lanjut, tetapi nilai atribut RAINY masih perlu dilakukan perhitungan lagi.

Pohon keputusan yang terbentuk sampai tahap ini adalah terlihat pada gambar berikut.

pohon2


Menghitung jumlah kasus, jumlah kasus untuk keputusan Yes, jumlah kasus untuk keputusan No, dan Entropy dari semua kasus dan kasus yang dibagi berdasarkan atribut TEMPERATURE dan WINDY yang dapat menjadi node cabang dari nilai atribut RAINY. Kemudian lakukan perhitungan Gain untuk tiap-tiap atribut. Hasil perhitungan seperti yang terdapat pada tabel berikut:


Dari hasil tabel

dapat diketahui bahwa atribut dengan Gain tertinggi adalah WINDY, yaitu sebesar 1. Jadi WINDY dapat menjadi node cabang dari nilai atribut RAINY. Ada dua nilai atribut dari WINDY, yaitu FALSE dan TRUE. Dari kedua nilai atribut tersebut, nilai atribut FALSE adalah 1, yaitu keputusannya Yes dan nilai atribut TRUE menjadi keputusan No, sehingga tidak perlu dilakukan perhitungan lebih lanjut untuk nilai atribut ini. Pohon keputusan yang terbentuk sampai tahap ini adalah terlihat pada gambar berikut:

pohon3

Gambar diatas merupakan gambar akhir dari proses Data Mining menggunakan algoritma C4.5 pada contoh kasus keputusan bermain tenis. Berdasarkan gambar di atas dapat ditarik kesimpulan bahwa jika humadity normal maka keputusannya adalah yes, jika humadity adalah high, outlook adalah cloudy maka keputusannya adalah bermain (yes), selanjutnya jika humadity adalah high, outlook adalah rainy dan windy adalah true, maka keputusannya adalah bermain (yes). Dan jika humadity adalah high, outlook adalah rainy dan windy adalah false, maka keputusannya adalah tidak bermain (no). Terakhit jika humadity adalah high, outlook adalah no, maka keputusannya adalah tidak bermain (no).

Tidak ada komentar:

Posting Komentar