Penerapan Borderline-SMOTE dan Grid Search pada Bagging-SVM untuk Klasifikasi Penyakit Diabetes

Trianto Trianto, Anita Muliawati, Helena Nurramdhani Irmanda

Abstract


Diabetes adalah penyakit berbahaya yang dapat menyebabkan kelumpuhan hingga mengancam jiwa penderitanya. Pada tahun 2019, Indonesia menempati peringkat ke-7 dari 10 negara dengan jumlah penderita terbanyak yaitu 10,7 juta penderita. Agar terhindar dari bahaya diabetes dapat menggunakan data mining untuk membangun model klasifikasi yang akan digunakan untuk melakukan prediksi dini. Algoritma klasifikasi yang bisa digunakan untuk membentuk model prediksi dini adalah support vector machine (SVM), sayangnya SVM memiliki kelemahan ketika diberikan data dengan kelas yang tidak seimbang dan sulitnya menentukan parameter optimal. Untuk mengatasi kelemahan tersebut akan digunakan algoritma grid search, borderline-SMOTE dan bagging. Hasil penelitian menunjukan bahwa model yang dibentuk dengan algoritma SVM, bagging, borderline-SMOTE dan grid search mendapat akurasi sebesar 92,1%, nilai precision sebesar 95,51% untuk kelas sehat dan 86,12% untuk kelas diabetes, nilai recall sebesar 92,32% untuk kelas sehat dan 91,66% untuk kelas diabetes, dan nilai f1-score sebesar 93,39% untuk kelas sehat dan 88,81% untuk kelas diabetes.

Keywords


klasifikasi, diabetes, SVM; bagging; borderline-SMOTE; grid search

References


Amelia, O. D., Soleh, A. M., & Rahardiantoro, S. (2018). Pemodelan Support Vector Machine Data Tidak Seimbang Keberhasilan Studi Mahasiswa Magister IPB. Xplore: Journal of Statistics, 2(1), 33–40. https://doi.org/10.29244/xplore.v2i1.76

Atlas, I. D. F. D. (2019). International Diabetes Federation. In The Lancet (Vol. 266, Issue 6881). https://doi.org/10.1016/S0140-6736(55)92135-8

Brownlee, Jason (2020, Maret 17). Machinelearningmastery. Dipetik Mei 22, 2022, dari https://machinelearningmastery.com/smote-oversampling-for-imbalanced-classification.

Fathur Rahman, I. (2020). Implementasi Metode Svm, Mlp Dan Xgboost Pada Data Ekspresi Gen. https://dspace.uii.ac.id/handle/123456789/23679

Gazni, H. A. Al. (2020). Optimasi Algoritma Support Vector Machine Berbasis Algoritma K-Means Dan Particle Swarm Optimization Pada Diagnosis Penyakit Ginjal Kronis.

Hairani, H., Saputro, K. E., & Fadli, S. (2020). K-means-SMOTE for handling class imbalance in the classification of diabetes with C4.5, SVM, and naive Bayes. Jurnal Teknologi Dan Sistem Komputer, 8(2), 89–93. https://doi.org/10.14710/jtsiskom.8.2.2020.89-93

Handayani, A., Jamal, A., & Septiandri, A. A. (2017). Evaluasi Tiga Jenis Algoritme Berbasis Pembelajaran Mesin untuk Klasifikasi Jenis Tumor Payudara. 6(4), 394–403.

Howsalya Devi, R. D., Bai, A., & Nagarajan, N. (2020). A novel hybrid approach for diagnosing diabetes mellitus using farthest first and support vector machine algorithms. Obesity Medicine, 17, 100152. https://doi.org/10.1016/j.obmed.2019.100152

Manurung, I. H. G. (2018). Hibrid Metode Information Gaindan Bagging Dalam Klasifikasi Data Menggunakan Support Vector Machine. In Analisis Kesadahan Total dan Alkalinitas pada Air Bersih Sumur Bor dengan Metode Titrimetri di PT Sucofindo Daerah Provinsi Sumatera Utara (Vol. 2).

Manurung, J. (2018). Optimasi Parameter pada Support Vector Machine dengan Algoritma Genetika untuk Penilaian Risiko Kredit.

Marjones H H Sihombing. (2019). KOMBINASI ALGO RITM A k-NN DAN SMOTE DALAM KLASIFIK ASI DATA TIDAK SEIMBANG.

Mayo Clinic. (2018). Diabetes. Dipetik November 21, 2021, dari https://www.mayoclinic.org/diseases-conditions/diabetes/symptoms-causes/syc-20371444

Moukhafi, M., El Yassini, K., & Bri, S. (2018). Mining network traffics for intrusion detection based on Bagging ensemble Multilayer perceptron with Genetic algorithm optimization. International Journal of Computer Science and Network Security, 18(5), 59–66. http://search.ijcsns.org/02_search/02_search_03.php?number=201805009

Muthahari, W. (2018). Analisis teknik resampling menggunakan synthetic minority oversampling technique (smote) untuk melatih support vector machine (svm) wadudi muthahari

Nugroho, A., & Religia, Y. (2021). Analisis Optimasi Algoritma Klasifikasi Naive Bayes menggunakan Genetic Algorithm dan Bagging. Jurnal RESTI (Rekayasa Sistem Dan Teknologi Informasi), 5(3), 504–510. https://doi.org/10.29207/resti.v5i3.3067

Prasetyo, E. (2013). Pengolahan Citra Digital dan Aplikasinya Menggunakan Matlab. Yogyakarta : Andi.

Prasetyo, V. R., Mercifia, M., Averina, A., Lauren, Sunyoto, & Budiarjo. (2022). Prediksi Rating Film Pada Website IMDB Menggunakan Metode Neural Network. Jurnal Ilmiah NERO, 7(1), 1–8

Pristyanto, Y. (2019). Penerapan Metode Ensemble Untuk Meningkatkan Kinerja Algoritme Klasifikasi Pada Imbalanced Dataset. Jurnal Teknoinfo, 13(1), 11. https://doi.org/10.33365/jti.v13i1.184.

Riyanto, U. (2019). Analisis Perbandingan Algoritma Naive Bayes Dan Support Vector Machine Dalam Mengklasifikasikan Jumlah Pembaca Artikel Online. JIKA (Jurnal Informatika), 2(2), 62–72. https://doi.org/10.31000/.v2i2.1521

Rousyati, R., Rais, A. N., Rahmawati, E., & Amir, R. F. (2021). Prediksi Pima Indians Diabetes Database Dengan Ensemble Adaboost Dan Bagging. EVOLUSI : Jurnal Sains Dan Manajemen, 9(2), 36–42. https://doi.org/10.31294/evolusi.v9i2.11159

Saputra, P. Y., Abdullah, M. Z., & Kirana, A. P. (2021). Improvisasi Teknik Oversampling MWMOTE Untuk Penanganan Data Tidak Seimbang. Jurnal Media Informatika Budidarma, 5(2), 398. https://doi.org/10.30865/mib.v5i2.2811

Siringoringo, R., & Kelana Jaya, I. (2018). Ensemble Learning Dengan Metode Smote Bagging Pada Klasifikasi Data Tidak Seimbang. 3(2), 75–81.

Sulistiana. (2020). Optimasi Support Vector Machine (SVM) Menggunakan Grid Search dan Unigram Guna Mengingkatkan Akurasi Review Pada Situs E-Commerce.

Syarif, I., Prugel-Bennett, A., & Wills, G. (2016). SVM Parameter Optimization using Grid Search and Genetic Algorithm to Improve Classification Performance. TELKOMNIKA (Telecommunication Computing Electronics and Control), 14(4), 1502. https://doi.org/10.12928/telkomnika.v14i4.3956

Verdikha, N. A., Adji, T. B., & Permanasari, A. E. (2018). Komparasi Metode Oversampling Untuk Klasifikasi Teks Ujaran Kebencian. Seminar Nasional Teknologi Informasi Dan Multimedia 2018, 85–90.

Wahyu Nugraha, A. S. (2022). Hyperparameter Tuning pada Algoritma Klasifikasi dengan Grid Search. SISTEMASI: Jurnal Sistem Informasi, 11, 391–401.

Wahyuni, D. (2019). Optimasi parameter support vector machine (svm) classifier menggunakan firefly algorithm (ffa) optimization untuk klasifikasi mri tumor otak.

Yunial, A. H. (2020). Analisis Optimasi Algoritma Klasifikasi Support Vector Machine, Decision Trees, dan Neural Network Menggunakan Adaboost dan Bagging. Jurnal Informatika Universitas Pamulang, 5(3), 247. https://doi.org/10.32493/informatika.v5i3.6609


Refbacks

  • There are currently no refbacks.


Copyright (c) 2023 Seminar Nasional Mahasiswa Bidang Ilmu Komputer dan Aplikasinya

Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.