Perbandingan Akurasi Klasifikasi Penyakit Diabates Menggunakan Algoritma Adaboost-Random Forest dan Adaboost- Decision Tree dengan Imputasi Median dan KNN

Desta Sandya Prasvita, Nadya Salsabila, Rizki Indah Pratiwi, Syifa Sabrina Anelia, Taufik Hidayat

Abstract


Diabetes merupakan penyakit yang ditandai dengan tingginya kadar gula (glukosa) darah. Pada penelitian ini dilakukan pendekatan dalam memprediksi penyakit menggunakan metode Adaboost-Random Forest dan Adaboost-Decision Tree dengan imputasi Median dan KNN, sehingga terdapat 4 tahapan uji klasifikasi. Tujuan penelitian ini yaitu membandingkan hasil akurasi prediksi dari algoritma yang digunakan, sehingga didapatkan hasil akurasi prediksi terbaik. Data yang digunakan yaitu Pima Indians Diabetes Dataset (PIDD) yang bersumber dari Kaggle. Hasil penelitian ini didapatkan model terbaik yaitu klasifikasi menggunakan algoritma Adaboost-Random Forest dengan imputasi median, model tersebut menghasilkan nilai akurasi terbesar 0.7786458 pada uji ke-8. Sedangkan hasil untuk model yang menggunakan algoritma Adaboost-Decision Tree dengan imputasi median menghasilkan nilai akurasi sebesar 0.7721354 pada nilai max_depth = 7, model klasifikasi menggunakan algoritma Adaboost-Random Forest dengan imputasi KNN menghasilkan nilai akurasi 0.77083 pada uji ke-5, sedangkan model dari algoritma Adaboost-Decision Tree dengan imputasi KNN menghasilkan nilai akurasi sebesar 0.74609375 pada nilai max_depth = 7.


Keywords


diabetes; random forest; decision tree; akurasi

References


Mahendra, B. et al. (2008) Care Yourself : Diabetes Mellitus. 1st edn. Jakarta: Penebar Plus.

Ulfa, N. M., Lubada, E. I. and Darmawan, R. (2020) Buku Ajar Farmasi Klinis dan Komunitas : Medication Picture dan Pill Count Pada Kepatuhan Minum Obat Penderita Diabetes Mellitus dan Hipertensi. 1st edn. Gresik: Graniti.

“Retinopati Diabetik” [Daring]. Tersedia pada: https://www.alodokter.com/retinopati- diabetik. [Diakses: 4-Juni-2020].

Noviandi, N. (2018). Implementasi Algoritma Decision Tree C4. 5 Untuk Prediksi Penyakit Diabetes. Indonesian of Health Information Management Journal (INOHIM), 6(01), 1-5.

Sudarto. (2016). Analisis Penanganan Ketidakseimbangan Kelas dengan menggunakan Density Based Feature Selection (DBFS) dan Adaptive Boosting (Adaboost) [Master's thesis, Universitas Sumatera Utara]. http://repositori.usu.ac.id/handle/123456789/1891.

Zehra, A., Asmawaty, T., & Aznan, M. (2014). A Comparative Study on The Pre- Processing and Mining of Pima Indian Diabetes Dataset. Technical report. 80, 98, 99, 102, 106, 138, 141, 142.


Refbacks

  • There are currently no refbacks.


Copyright (c) 2021 Senamika

Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.