PERBANDINGAN NORMALISASI DATA UNTUK KLASIFIKASI WINE MENGGUNAKAN ALGORITMA NAÏVE BAYES, DECISSION TREE, DAN SUPPORT VECTOR MACHINE

Fikri Adams, Realdy Anggoro, Muhammad Satria, Anggun Oktavia, Nurul Chamidah

Abstract


Dalam melakukan klasifikasi data menggunakan algoritma machine learning, keseimbangan rentang nilai pada suatu atribut dapat mempengaruhi kualitas hasil dari performa model klasifikasinya. Oleh karena itu, dataset dalam suatu penelitian diperlukan diterapkan tahap praproses data agar menghasilkan model klasifikasi dengan akurasi yang baik. Metode praproses data menggunakan tiga cara, yaitu normalisasi min-max, z-score dan decimal scaling. Setiap normalisasi data dikombinasikan dengan tiga algoritma machine learning, yaitu algoritma Naïve Bayes, Decission Tree, dan Support Vector Machine untuk mencari akurasi model yang terbaik dalam mengklasifikasikan dataset wine. Hasil perbandingan kombinasi ketiga metode klasifikasi dan ketiga metode normalisasi data menunjukkan bahwa akurasi terbaik terdapat pada algoritma Support Vector Machine dengan normalisasi decimal scaling dengan akurasi rata-rata yang diperoleh sebesar 57,1%. Hasil penelitian kali ini juga menunjukan bahwa suatu metode normalisasi data bisa saja mendapatkan hasil rata-rata akurasi tertinggi pada algoritma klasifikasi tertentu, akan tetapi belum tentu unggul apabila menggunakan metode klasifikasi yang lain.


Keywords


Normalisasi; Support Vector Machine; Decission Tree; Naïve Bayes

References


D. A. Nasution, H. H. Khotimah, and N. Chamidah, “Perbandingan Normalisasi Data untuk Klasifikasi Wine Menggunakan Algoritma K-NN,” Comput. Eng. Sci. Syst. J., vol. 4, no. 1, p. 78, 2019, doi: 10.24114/cess.v4i1.11458.

N. Chamidah, . W., and U. Salamah, “Pengaruh Normalisasi Data pada Jaringan Syaraf Tiruan Backpropagasi Gradient Descent Adaptive Gain (BPGDAG) untuk Klasifikasi,” J. Teknol. Inf. ITSmart, vol. 1, no. 1, p. 28, 2012.

A. L. Waterhouse, G. L. Sacks, and D. W. Jeffery, Understanding Wine Chemistry. O’Reilly Media, Inc., 1005 Gravenstein Highway North, Sebastopol, CA 95472., 2016.

M. Bowles, Machine Learning in Python: Essential Techniques for Predictive Analysis. 2015.

Chris Albon, Machine Learning with Python Cookbook Practical Solutions from Preprocessing to Deep Learning. O’Reilly Media, Inc., 1005 Gravenstein Highway North, Sebastopol, CA 95472., 2018.

J. Han and M. Kamber, Data Mining: Concepts and Techniques Second Edition. Diane Cerra, 2007.

I. H. Witten, E. Frank, M. A. Hall, and C. J. Pal, Data Mining: Practical Machine Learning Tools and Techniques. Morgan Kaufmann; 3rd edition (January 20, 2011), 2016.

S. Raschka, Python Machine Learning: Unlock deeper insights into Machine Leaning with this vital guide to cutting-edge predictive analytics. Packt Publishing Ltd, 2015.

H. Widayu, S. Darma, N. Silalahi, and Mesran, “Data Mining Untuk Memprediksi Jenis Transaksi Nasabah Pada Koperasi Simpan Pinjam Dengan Algoritma C4.5,” Issn 2548-8368, vol. Vol 1, No, no. June, p. 7, 2017, [Online]. Available: https://ejurnal.stmik-budidarma.ac.id/index.php/mib/article/view/323.

S. Raschka and V. Mirjalili, Python Machine Learning Third edition, vol. 53. Packt Publishing Ltd, 2019.

A. M. Pravina, I. Cholissodin, and P. P. Adikara, “Analisis Sentimen Tentang Opini Maskapai Penerbangan pada Dokumen Twitter Menggunakan Algoritme Support Vector Machine (SVM),” J. Pengemb. Teknol. Inf. dan Ilmu Komput., vol. 3, no. 3, pp. 2789–2797, 2019, [Online]. Available: http://j-ptiik.ub.ac.id.

A. Novantirani, M. K. Sabariah, and V. Effendy, “Analisis Sentimen pada Twitter untuk Mengenai Penggunaan Transportasi Umum Darat Dalam Kota dengan Metode Support Vector Machine,” e-Proceeeding Eng., vol. 2, no. 1, pp. 1–7, 2015.

J. LING, I. P. E. N. KENCANA, and T. B. OKA, “Analisis Sentimen Menggunakan Metode Naïve Bayes Classifier Dengan Seleksi Fitur Chi Square,” E-Jurnal Mat., vol. 3, no. 3, p. 92, 2014, doi: 10.24843/mtk.2014.v03.i03.p070.


Refbacks

  • There are currently no refbacks.


Copyright (c) 2022 Senamika

Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.