Perbandingan Algoritma Random Forest, Naive Bayes, Dan Decision Tree Dengan Oversampling Untuk Klasifikasi Bakteri E.Coli

Alvita Izana Kusumarini, Pandu Ananto Hogantara, Muammar Fadhlurohman, Nurul Chamidah, S.Kom., M.Kom

Abstract


Berbagai jenis bakteri dapat dibedakan berdasarkan klasifikasi bakteri yang juga tergantung varietas dari bakteri tersebut. Suatu hal penting dalam mengidentifikasi bakteri adalah melalui karakteristik yang dapat diamati pada bakteri tersebut yang memanfaatkan ciri bentuk serta melalui perwarnaan sifat dari bakteri itu sendiri. Karakteristik yang dapat diamati dari suatu bakteri dapat diklasifikasi dengan memanfaatkan algoritma-algoritma klasifikasi. Pada penelitian ini dataset yang digunakan yaitu dataset E. coli yang merupakan data sekunder. Kemudian dilakukan praproses data dengan menghilangkan kolom ID yang sifatnya unik di tiap sampel data. Lalu membagi data terlebih dahulu menjadi 70% data latih dan 30% data uji. Data latih akan dibagi lagi menggunakan k-fold cross validation dengan nilai  yang dimana akan menghasilkan data latih sebanyak 211 sampel dan data validasi sebanyak 24 sampel. Untuk membuktikan algoritma dengan akurasi terbaik, maka proses klasifikasi dilakukan menggunakan tiga model algoritma sebagai perbandingan yaitu algoritma random forest, Naïve Bayes dan decision tree yang sebelumnya juga pernah dilakukan dengan penelitian dan dataset yang berbeda. Pada proses pelatihan model juga akan dilakukan proses hyperparameter tuning, yaitu proses pencarian parameter terbaik untuk mendapatkan hasil akurasi yang terbaik. Hasil yang didapatkan menjelaskan bahwa algoritma random forest memiliki akurasi tertinggi yaitu sebesar 84%.


Keywords


Klasifikasi; Random Forest; Naïve Bayes; Decision Tree; E. coli; K-Fold Cross Validation

References


S. N. Chatterjee and K. Chaudhuri, "Outer Membrane Vesicles: Interaction with Prokaryotes and Eukaryotes," SpringerBriefs in Microbiology, pp. 71-79, 2012.

E. Priyanti, "Penerapan Algoritma Naïve Bayes Untuk Klasifikasi Bakteri Gram-Negatif," Jurnal Teknik Informatika, vol. 3, no. 2, pp. 68-76, 2017.

K. Nakai, "UCI Machine Learning Repository: Ecoli Data Set," [Online]. Available: http://archive.ics.uci.edu/ml/datasets/Ecoli/. [Accessed 22 Maret 2021].

I. Sutoyo, "IMPLEMENTASI ALGORITMA DECISION TREE UNTUK KLASIFIKASI DATA PESERTA DIDIK," Jurnal Pilar Nusa Mandiri, vol. 14, no. 2, pp. 217-224, 2018.

A. Primajaya and B. N. Sari, "Random Forest Algorithm for Prediction of Precipitation," Indonesian Journal of Artificial Intelligence and Data Mining (IJAIDM), vol. 1, no. 1, pp. 27-31, 2018.

T. R. Patil and S. S. Sherekar, "Performance Analysis of Naive Bayes and J48 Classification Algorithm for Data Classification," International Journal Of Computer Science And Applications, vol. 6, no. 2, pp. 256-261, 2013.

I. B. A. Peling, I. N. Arnawan, I. P. A. Arthawan and I. G. N. Janardana, "Implementation of Data Mining To Predict Period of Students Study Using Naive Bayes Algorithm," International Journal of Engineering and Emerging Technology, vol. 2, no. 1, pp. 53-57, 2017.

S. D. Jadhav and H. P. Channe, "Comparative Study of K-NN, Naive Bayes and Decision Tree Classification Techniques," International Journal of Science and Research (IJSR), vol. 5, no. 1, pp. 1842-1845, 2016.

S. Singh and P. Gupta, "COMPARATIVE STUDY ID3, CART AND C4.5 DECISION TREE ALGORITHM: A SURVEY," International Journal of Advanced Information Science and Technology (IJAIST) , vol. 27, no. 27, pp. 97-103, 2014.

A. E. Maxwell, T. A. Warner and F. Fang, "Implementation of machine-learning classification in remote sensing: an applied review," International Journal of Remote Sensing, vol. 39, no. 9, pp. 2784-2817, 2018.

R. Salla, H. Wilhelmiina, K. Sari, M. Mikaela, M. Pekka and M. Jaakko, "Evaluation of the confusion matrix method in the validation of an automated system for measuring feeding behaviour of cattle," Behavioural Processes, vol. 148, pp. 56-62, 2018.

T. Nguyen, I. Hettiarachchi, A. Khatami, L. Gordon-Brown, C. P. Lim and S. Nahavandi, "Classification of Multi-class BCI Data by Common Spatial Pattern and Fuzzy System," IEEE Access, vol. 6, pp. 27873-27884, 2018.


Refbacks

  • There are currently no refbacks.


Copyright (c) 2021 Senamika

Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.