Assignment 3: Prediksi Elektabilitas menggunakan Data Training

PREDIKSI ELEKTABILITAS MENGGUNAKAN DATA TRAINING

Apa itu machine learning? Machine Learning adalah ilmu cabang dari kecerdasan buatan yang mempelajari bagaimana caranya belajar dari data. Istilah Machine Learning sendiri cukup membingungkan, karena hampir tidak berhubungan dengan mesin apapun. Mesin disini merujuk kepada algoritma atau program yang berjalan di komputer.

Berbicara mengenai machine learning, saya akan menjelaskan sedikit mengenai machin learning, yaitu analisis dari impementasi machine learning, mengenai prediksi elektabilitas dengan data training menggunakan decision tree, naive bayes, dan k-nearest neighbor, dengan tahap-tahap sebagai berikut:

  1. Tahap awal saya menggunakan aplikasi orange unuk memprediksi data yang ada yaitu pemilukpu.xls.
  2. Meyusun widget apa saja yang terlibat, dan dimasukan kedalam software yang digunakan, yaitu orange.

no 2 pertama

Bisa dilihat dari gambar diatas, dengan widget yang ada, saya menggunakan random forest untuk desicion tree, naive bayes, dan KNN dengan proporsi data training 80%, dan dengan melakukan data training sebanyak 100 kali.

no 2 kedua

Dilihat dari hasil yang ada pada gambar diatas, algoritma KNN memiliki nilai akurasi yang paling tinggi, yaitu 0,913, diikuti dengan random forest dengan nilai akurasi 0,896, dan yang terakhir adalah naive bayes, dengan nilai akurasi 0,708.

  1. Menggunakan 10-fold x validation untuk melakukan data testing.

no 3 pertama

Dari gambar diatas, dengan melakukan x falidation sebanyak 10 fold, hasilnya akan muncul seperti dibawah ini:

no 3 one

no 3 two

no 3 three

Hasil dari menguji 10-fold x validation diatas, kita dapatkan bahwa dari segi akurasi yang kinerjanya paling baik adalah KNN dengan nilai akurasi paling tinggi, yaitu 0,911 dan dengan nilai AUC terendah, yaitu 0,885.

Hasil dari analisis diatas, dapat disimpulkan bahwa KNN memiliki kinerja yang paling baik, dan algoritma yang dipilih untuk memprediksi elektabilitas adalah algoritma KNN karena memiliki kinerja yang paling baik, dibandingkan dengan algoritma random forest yang memiliki nilai akurasi 0,904, serta nilai AUC 0,890, dan naive bayes dengan nilai akurasi 0,718 dan nilai AUC sebesar 0,893.

Sumber: https://mitbal.wordpress.com/2014/01/18/ml-apa-itu-machine-learning/

Leave a Reply

Your email address will not be published. Required fields are marked *