Implementasi Seleksi Fitur pada Algoritma Klasifikasi Machine Learning untuk Prediksi Penghasilan pada Adult Income Dataset

Serafim Clara, Dhea Laksmi Prianto, Rizal Al Habsi, Ester Friscila Lumbantobing, Nurul Chamidah

Abstract


Setiap orang mempunyai penghasilan yang berbeda-beda. Prediksi pada Income Adult Dataset menggunakan dua algoritma klasifikasi yaitu Naive Bayes dan Random forest untuk mengetahui nilai akurasi dengan mengimplementasikan seleksi fitur agar dapat mengetahui fitur yang paling berpengaruh. Eksperimen awal ialah melakukan analisis data. Target atribut yang digunakan adalah Income. Data memiliki 7% missing value pada beberapa atribut, oleh karena itu dibutuhkan beberapa proses pre-processing data sebelum melakukan tahap klasifikasi. Setelah melalui pre-processing, dilanjutkan dengan menerapkan seleksi fitur dengan memilih kandidat atribut yang terbaik dari hasil pertama dan selanjutnya dapat mengoptimalkan algoritma ini untuk memodelkan data terbaik. Hasil eksperimen menunjukkan bahwa Naïve Bayes adalah algoritma terbaik dari algoritma klasifikasi lainnya dengan hasil akurasi sebesar 84,51%.


Keywords


seleksi fitur, Naïve Bayes, Random forest, Gradient Descent Classifier

References


Miao, J., & Niu, L. (2016). A Survey on Feature Selection. Procedia Computer Science, 91.

Saritas, M. M. (2019). Performance Analysis of ANN and Naive Bayes Classification Algorithm for Data Classification. International Journal of Intelligent Systems and Applications in Engineering, 7(2).

Dhawangkhara, M., & Riksakomara, E. (2017). Prediksi Intensitas Hujan Kota Surabaya dengan Matlab menggunakan Teknik Random Forest dan CART (Studi Kasus Kota Surabaya). Jurnal Teknik ITS, 6(1).

Suyanto. (2018). Machine learning tingkat dasar dan lanjut, bandung, informatika

Verma, A. (2018). Study and Evaluation of Classification Algorithms in Data Mining. International Research Journal of Engineering and Technology, 5(8).

Handian, D. (2017). gradDescentR 2.0: IMPLEMENTASI METODE GRADIENT DESCENT DAN VARIASINYA DALAM R PACKAGE (Doctoral dissertation, Universitas Pendidikan Indonesia).

Tyas, R. A., Anggraini, M., Sulasiyah, I. A., & Aini, Q. (2020). Implementasi Algoritma Naïve Bayes Dalam Penentuan Rating Buku. SISTEMASI: Jurnal Sistem Informasi, 9(3), 557-566.

Rahman, M. F., Darmawidjadja, M. I., & Alamsah, D. (2017). Klasifikasi untuk diagnosa diabetes menggunakan metode bayesian regularization neural network (rbnn). J. Inform, 11(1), 36.


Refbacks

  • There are currently no refbacks.


Copyright (c) 2021 Senamika

Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.