Assignment 4 (part1 ): Decision tree menggunakan algoritma C4.5

DECISION TREE MENGGUNAKAN ALGORITMA C4.5

Langkah-langkah membuat Decision tree menggunakan algoritma C4.5:

  1. Drag e-reader adoption training dan e-reader adoption scoring ke dalam rapid miner studio.
  1. Drag operator set role sebanyak 3 kali dan hubungkan set role 1 dan set role 2 setelah dataset e-reader adoption training, dan set role 3 dihubungkan dengan e-reader adoption scoring.
  1. Drag operator decision tree, lalu hubungkan dengan set role 2.
  1. Drag operator apply model, dan hubungkan dengan decision tree, juga dengan set role 3 seperti susunan konfigurasi pada gambar dibawah ini:

c

  1. Klik pada operator set role 1, pilih target user_ID dan kriteria ID, lalu menambahkan entry e-reader adoption dengan kriteria label, lakukan langkah yang sama pada set role 2 dan 3.
  1. Klik dua kali pada operator decision tree dan pilih information gain pada kolom criterion.
  2. Hubungkan apply model dengan titik akhir test dan result.
  1. Klik tombol play, dan tunggu sampai muncul hasil dari decision tree seperti gambar dibawah ini:

big data

ANALISIS:

Dari dataset e-reader adoption training dan scoring, saya menggunakan algoritma C4.5 karena, model decision tree lebih simple dan lebih mudah diinterpretasikan. Serta tersedia script dari deskripsi decision tree tersebut, seperti gambar dibawah ini:

a

Adapun visualisasi hasil dari klasifikasinya, menggunakan diagram cluster adalah sebagai berikut:

b

KESIMPULAN:

Berdasarkan analisis di atas, dataset e-reader adoption training dan scoring cocok menggunakan algoritma C4.5, karena jumlah variable dalam dataset tersebut tidak terlalu banyak, sehingga pemodelan data tidak terlalu kompleks. Hal tersebut menjadikan model decision tree dengan algoritma C4.5 dapat menghasilkan decision tree yang mudah di interpretsaikan dengan model yang simple (information gain).

 

 

 

 

 

Leave a Reply

Your email address will not be published. Required fields are marked *