Teknik SMOTE untuk Mengatasi Imbalance Class dalam Klasifikasi Bank Customer Churn Menggunakan Algoritma Naïve bayes dan Logistic Regression
Abstract
Churn nasabah menjadi permasalahan serius bagi Bank karena kehilangan nasabah berarti kehilangan pendapatan dan potensi kerugian jangka panjang. Untuk mencegah hal tersebut, diperlukannya teknologi masa kini untuk mengklasifikasi nasabah yang akan pergi (churn) atau bertahan melalui pemodelan machine learning algoritma Naïve Bayes Classifier dan algoritma Logistic Regression. Model klasifikasi dibuat untuk mempertahankan nasabah Bank berdasarkan data nasabah. Teknik SMOTE digunakan untuk mengatasi masalah imbalance class pada data yang digunakan, dan model di evaluasi dengan nilai accuracy, precision, recall, dan f1-score. Model terbaik yang dihasilkan ketika menggunakan teknik SMOTE ternyata mengalami penurunan nilai akurasi sebesar 13% pada algoritma Gaussian Naïve Bayes, model tanpa teknik SMOTE dengan akurasi sebesar 82% dan dengan teknik SMOTE sebesar 69%. Gaussian Naïve Bayes berhasil mengungguli jika dibandingkan dengan Complement Naïve Bayes dan Logistic Regression.
Keywords
Full Text:
PDF (Bahasa Indonesia)References
Miryam Clementine and Arum. (2022). Prediksi Churn Nasabah Bank Menggunakan Klasifikasi Naïve Bayes dan ID3. Jurnal Processor, vol. 17, no. 1. doi: 10.33998/processor.2022.17.1.1170.
D. Fitrianah, S. Dwiasnati, H. H. H, and K. A. Baihaqi. (2021). Penerapan Metode Machine Learning untuk Prediksi Nasabah Potensial menggunakan Algoritma Klasifikasi Naïve Bayes. Faktor Exacta, vol. 14, no. 2, p. 92. doi: 10.30998/faktorexacta.v14i2.9297.
H. N. Irmanda, R. Astriratma, and S. Afrizal. (2019). Perbandingan Metode Jaringan Syaraf Tiruan Dan Pohon Keputusan Untuk Prediksi Churn Universitas Pembangunan Nasional Veteran Jakarta. JSI : Jurnal Sistem Informasi (E-Journal), vol. 11, no. 2, [Online]. Available: http://ejournal.unsri.ac.id/index.php/jsi/index
M. R. Romadhon and F. Kurniawan. (2021). A Comparison of Naive Bayes Methods, Logistic Regression and KNN for Predicting Healing of Covid-19 Patients in Indonesia,” in 3rd 2021 East Indonesia Conference on Computer and Information Technology. EIConCIT 2021, Institute of Electrical and Electronics Engineers Inc., pp. 41–44. doi: 10.1109/EIConCIT50028.2021.9431845.
K. Polat. (2019). Freezing of Gait (FoG) Detection Using Logistic Regression in Parkinson’s Disease from Acceleration Signals. Scientific Meeting on Electrical-Electronics & Biomedical Engineering and Computer Science (EBBT), IEEE.
O. Febri, R. #1, A. #2, and A. Aditsania. Handling Imbalanced Data pada Prediksi Churn menggunakan metode SMOTE dan KNN Based on Kernel Handling Imbalanced Data on Churn Prediction using SMOTE and KNN Based on Kernel Methods.
Y. Nora Marlim, L. Suryati, and N. Agustina. (2022). Deteksi Dini Penyakit Diabetes Menggunakan Machine Learning dengan Algoritma Logistic Regression.
S. Keputusan Dirjen Penguatan Riset dan Pengembangan Ristek Dikti, A. Nikmatul Kasanah, U. Pujianto, T. Elektro, F. Teknik, and U. Negeri Malang. (2017). Terakreditasi SINTA Peringkat 2 Penerapan Teknik SMOTE untuk Mengatasi Imbalance Class dalam Klasifikasi Objektivitas Berita Online Menggunakan Algoritma KNN. vol. 1, no. 3, pp. 196–201.
E. Sutoyo, M. Asri Fadlurrahman, J. Telekomunikasi Jl Terusan Buah Batu, K. Dayeuhkolot, K. Bandung, and J. Barat. JEPIN (Jurnal Edukasi dan Penelitian Informatika) Penerapan SMOTE untuk Mengatasi Imbalance Class dalam Klasifikasi Television Advertisement Performance Rating Menggunakan Artificial Neural Network.
“Bank Customer Churn Dataset | Kaggle.” https://www.kaggle.com/datasets/gauravtopre/bank-customer-churn-dataset (accessed Aug. 23, 2023).
Refbacks
- There are currently no refbacks.
Copyright (c) 2023 Prosiding Seminar Nasional Mahasiswa Bidang Ilmu Komputer dan Aplikasinya
This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.