KLASIFIKASI SENTIMEN DATA TIDAK SEIMBANG MENGGUNAKAN ALGORITMA SMOTE DAN K-NEAREST NEIGHBOR PADA ULASAN PENGGUNA APLIKASI PEDULILINDUNGI

Sheila Gabriela Barus, Didit Widiyanto, Mayanda Mega Santoni

Abstract


Salah satu penanganan pemerintah dalam mengatasi penyebaran  Covid-19 yang terjadi di Indonesia yaitu dengan membuat sebuah aplikasi yaitu aplikasi PeduliLindungi. Aplikasi ini berfungsi dalam melacak dan memantau penyebaran Covid-19, oleh karena itu banyak masyarakat Indonesia yang harus mempunyai aplikasi ini. Banyak juga ulasan yang diberikan pada aplikasi ini, dari komentar yang positif hingga komentar negatif. Ulasan tersebut yang menjadi data dalam penelitian ini untuk mengetahui hasil sentimen masyarakat dan menguji klasifikasi algoritma K-Nearest Neighbor. Pengumpulan data dilakukan dengan scraping di google play menggunakan bahasa pemrograman Python, dimana data yang diperoleh mendapatkan 750 label negatif  dan 250 label positif. Sehingga data yang tidak seimbang ini harus diseimbangkan dengan teknik undersampling dan oversampling SMOTE. Oleh karena itu, penelitian ini dilakukan tiga data yang berbeda jumlah yaitu dari data yang tidak seimbang, data yang sudah di undersampling dan data yang sudah di oversampling dengan SMOTE. Hasil dari ketiga percobaan tersebut diperoleh nilai terbaik menggunakan teknik SMOTE  pada K = 1 dengan nilai akurasi sebesar 0.9766, nilai presisi sebesar 0.9691, nilai F1 score 0.9781, nilai spesifisitas sebesar 0.9645, dan nilai sensitivitas sebesar 0.9874.

Keywords


Sentimen;K-Nearest Neighbor;SMOTE;PeduliLindungi

References


Firmansyah, R. F. N., Fauzi, M. A., & Afirianto, T. (2016). Sentiment Analysis pada Review Aplikasi Mobile Menggunakan Metode Naive Bayes dan Query Expansion. Doro Ptiik, 8(December), 14.

Fridom Mailo, F., Lazuardi, L., Manajemen dan kebijakan Kesehatan Fakultas Kedokteran, D., Masyarakat dan Keperawatan Universitas Gadjah Mada, K., Sistem Informasi Manajemen Kesehatan Fakultas Kedokteran, D., Masyarakat dan Keperawatan, K., & Gadjah Mada, U. (2019). Analisis Sentimen Data Twitter Menggunakan Metode Text Mining Tentang Masalah Obesitas di Indonesia. Jurnal Sistem Informasi Kesehatan Masyarakat Journal of Information Systems for Public Health, 4(1), 28–36. https://jurnal.ugm.ac.id/jisph/article/view/44455

Kurniawan, M. A. A., Ermatita, E., & Falih, N. (2020). Pemanfaatan Pengolahan Citra dan Klasifikasi K-Nearest Neighbor pada Citra Telur Ayam. Informatik : Jurnal Ilmu Komputer, 16(3), 164. https://doi.org/10.52958/iftk.v16i3.2131

Roihan, A., Sunarya, P. A., & Rafika, A. S. (2020). Pemanfaatan Machine Learning dalam Berbagai Bidang: Review paper. IJCIT (Indonesian Journal on Computer and Information Technology), 5(1), 75–82. https://doi.org/10.31294/ijcit.v5i1.7951

Sari, F. V., & Wibowo, A. (2019). Analisis Sentimen Pelanggan Toko Online Jd. Id Menggunakan Metode Naïve Bayes Classifier Berbasis Konversi Ikon Emosi. Simetris: Jurnal Teknik Mesin, Elektro Dan Ilmu Komputer, 2(2), 681–686.

Adhi Putra, A. D., & Juanita, S. (2021). Analisis Sentimen pada Ulasan pengguna Aplikasi Bibit Dan Bareksa dengan Algoritma KNN. JATISI (Jurnal Teknik Informatika Dan Sistem Informasi), 8(2), 636–646. https://doi.org/10.35957/jatisi.v8i2.962

Fitrianti, R. P., Kurniawati, A., & Agusten, D. (2019). Implementasi Algoritma K - Nearest Neighbor Terhadap Analisis Sentimen Review Restoran Dengan Teks Bahasa Indonesia. Journal of Chemical Information and Modeling, 53(9), 1689–1699.

Isnain, A. R., Supriyanto, J., & Kharisma, M. P. (2021). Implementation of K-Nearest Neighbor ( K-NN ) Algorithm For Public Sentiment Analysis of Online Learning. Teknik Informatika Dan Sistem Informasi, 15(2), 121–130. https://doi.org/10.22146/ijccs.65176

Nurhidayati, N., Sugiyah, S., & Yuliantari, K. (2021). Pengaturan Perlindungan Data Pribadi Dalam Penggunaan Aplikasi Pedulilindungi. Widya Cipta: Jurnal Sekretari Dan Manajemen, 5(1), 39–45. https://doi.org/10.31294/widyacipta.v5i1.9447

Olivia, D. O., Rosadi, S. D., & Permata, R. R. (2020). PERLINDUNGAN DATA PRIBADI DALAM PENYELENGGARAAN APLIKASI SURVEILANS KESEHATAN PEDULILINDUNGI DAN COVIDSAFE DI INDONESIA DAN AUSTRALIA. Sustainability (Switzerland), 4(1), 1–9. https://pesquisa.bvsalud.org/portal/resource/en/mdl-20203177951%0Ahttp://dx.doi.org/10.1038/s41562-020-0887-9%0Ahttp://dx.doi.org/10.1038/s41562-020-0884-z%0Ahttps://doi.org/10.1080/13669877.2020.1758193%0Ahttp://sersc.org/journals/index.php/IJAST/article

PDPI. (2020). A comparison of the Indian Health Service counseling technique with traditional, lecture-style counseling. In Journal of the American Pharmacists Association (Vol. 55, Issue 5). https://doi.org/10.1331/JAPhA.2015.14093

Sari, R. (2020). Analisis Sentimen Pada Review Objek Wisata Dunia Fantasi Menggunakan Algoritma K-Nearest Neighbor (K-Nn). EVOLUSI : Jurnal Sains Dan Manajemen, 8(1), 10–17. https://doi.org/10.31294/evolusi.v8i1.7371

Sudiarsa, I. W., & Wiraditya, I. G. B. (2020). Analisis Usability Pada Aplikasi Peduli Lindungi Sebagai Aplikasi Informasi Dan Tracking Covid-19 Dengan Heuristic Evaluation. Journal of Information Technology and Computer Sains, 3(2), 354–364.

Susilo, A., Rumende, C. M., Pitoyo, C. W., Santoso, W. D., Yulianti, M., Herikurniawan, H., Sinto, R., Singh, G., Nainggolan, L., Nelwan, E. J., Chen, L. K., Widhani, A., Wijaya, E., Wicaksana, B., Maksum, M., Annisa, F., Jasirwan, C. O. M., & Yunihastuti, E. (2020). Coronavirus Disease 2019:

Bode, A. (2017). K-Nearest Neighbor dengan Feature Selection Menggunakan Backward Elimination untuk Prediksi Harga Komoditi Kopi Arabika. ILKOM Jurnal Ilmiah, 9(2), 188–195.

Tuhuteru, H. (2020). Analisis Sentimen Masyarakat Terhadap Pembatasan Sosial Berskala Besar Menggunakan Algoritma Support Vector Machine. INFORMATION SYSTEM DEVELOPMENT (ISD), 5(2), 7-13.

Siringoringo, R. (2018). Klasifikasi Data Tidak Seimbang Menggunakan Algoritma SMOTE dan K-Nearest Neighbor. Jurnal ISD, 3(1), 44-49.

Salbilla, W. I., & Vista. (2021). Implementasi SMOTE dan Under Sampling pada Imbalanced Dataset untuk Prediksi Kebangkrutan Perusahaan


Refbacks

  • There are currently no refbacks.


Copyright (c) 2023 Seminar Nasional Mahasiswa Bidang Ilmu Komputer dan Aplikasinya

Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.