Perbandingan Metode Klasifikasi Naive Bayes, Decision Tree Dan K-Nearest Neighbor Pada Data Log Firewall

Gebrina Divva Meuthia Zulma, Ange lika, Nurul Chamidah

Abstract


Penelitian ini bertujuan untuk membandingkan tiga metode klasifikasi, yaitu K-Nearest Neighbor, Naive BayesDecision Tree.Dataset log firewall bisa didapatkan pada situs UCI Machine Learning. Agar mendapatkan hasil yang maksimal, dataset harus melalui tahap preprocessing.Setelah itu, data divalidasi menggunakan StratifiedKFold dengan n_splits sebanyak 10 .Untuk pengujian performa pada ke tiga algoritma tersebut, precision, recall, akurasi serta nilai ROC AUC nya untuk digunakan sebagai bahan pertimbangan metode klasifikasi manakah yang terbaik serta dapat memproses dataset yang disajikan. Decision Tree menjadi metode dengan akurasi 100% dan nilai AUC sebesar 75%, disusul K-Nearest Neighbor dengan akurasi 99% dan nilai AUC sebesar 74%,  namun Naive Bayes dianggap tidak latyak untuk memproses data karena meskipun nilai akurasinya 96%, nilai AUC termasuk rendah yaitu 46%. Hasil dari penelitian ini diharapkan dapat menjadi acuan untuk penelitian metode klasifikasi lain, baik menggunakan data yang sama maupun menggunakan klasifikasi yang berbeda.

Keywords


K-Nearest Neighbor; Naive Bayes; Decision Tree

References


Oktaviani. 2007. Mengenal Sistem Firewall. 1-12.

Kana, Saputra., Siahaan, Andysah Putera U. 2007. Klasifikasi Data Minuman Wine Menggunakan Algoritma K-Nearest Neighbor. 2–4.

Wahyuningsih, Sri., Utari, Dyah Retno. 2018. Perbandingan Metode K-Nearest Neighbor, Naïve Bayes dan Decision Tree untuk Prediksi Kelayakan Pemberian Kredit. Konferensi Nasional Sistem Informasi 2018, 619-623.

Marutho, Dhendra. (2019). Perbandingan Metode Naïve Bayes, KNN, Decision Tree Pada Laporan Water Level Jakarta. INFOKAM. Vol. 15 No. 2:90-97.

Setiyorini, Tyas,. Asmono, Rizky T. 2018. Komparasi Metode Decision Tree, Naïve Bayes dan K-Nearest Neighbor Pada Klasifikasi Kinerja Siswa, Jurnal TECHNO Nusa Mandiri. Vol. 15, No.2.

Ambarwari, Agus., Adrian, Qadhli Jafar., Herdiyeni, Yeni. (2020). Analisis Pengaruh Data Scaling Terhadap Performa Algoritme Machine Learning untuk Identifikasi Tanaman. Jurnal Resti. Vol 4 No. 1:117-122.

Nasution, Darnisa Azzahra, et. al. 2019. “Perbandingan Normalisasi Data Untuk Klasifikasi Wine Menggunakan Algoritma KNN” dalam Journal of Computer Engineering System and Science, Vol. 4, No. 1:78-82.

Z2 Little. 2020. StratifiedKFold v.s KFold v.s StratifiedShuffleSplit.

Syarli., Muin, Asrul Ashari. 2016. Metode Naive Bayes Untuk Prediksi Kelulusan (Studi Kasus: Data Mahasiswa Baru Perguruan Tinggi). Jurnal Ilmiah Ilmu Komputer, Vol. 2, No. 1:22-26.

Kasih, Patmi. 2019. Pemodelan Data Mining Decision Tree Dengan Classification Error Untuk Seleksi Calon Anggota Tim Paduan Suara. Innovation in Research of Informatics, Vol. 1, No.2:63-69.

Yustanti, Wiyli. 2012. Algoritma K-Nearest Neighbour untuk Memprediksi Harga Jual Tanah. Jurnal Matematika, Statistika dan Komputasi, Vol. 9, No.1:57-68.

Pudjiarti, Eni. 2016. Prediksi Spam Email Menggunakan Metode Support Vector Machine dan Particle Swarm Optimization. Jurnal Pilar Nusa Mandiri, Vol.12, No.2:171-181.

Kaya, Mustafa., Ertam, Fatih. 2018. Classification of Firewall Log Files with Multiclass Support Vector Machine. IEEE.


Refbacks

  • There are currently no refbacks.


Copyright (c) 2021 Senamika

Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.