Pengaruh Seleksi Fitur pada Algoritma Machine Learning untuk Memprediksi Pembatalan Pesanan Hotel

I Gusti Naufhal Daffa Adnyana, Roihan Mufli Arjuna, Alfiyah Nur Indraini, Desta Sandya Prasvita

Abstract


Perkembangan media berbasis online mempengaruhi konsumen dalam melakukan pencarian informasi suatu produk dan jasa, salah satunya jasa pemesanan hotel dimana terdapat sistem Booking. Penelitian ini bertujuan untuk mengetahui pengaruh seleksi fitur terhadap performa algoritma machine learning dengan menggunakan dataset Hotel Booking Demand . Algoritma yang digunakan adalah Decision Tree dan Random Forest dengan menggunakan PCA untuk menemukan fitur yang berpengaruh dalam konsumen dalam melakukan pembatalan hotel. Hasil dari penelitian ini berupa nilai akurasi dari setiap algoritma dengan menggunakan seleksi fitur. Hasil akurasi dengan 3 , 5 dan 14 fitur menggunakan algoritma Decision Tree sebesar 0,954, 0,963, 0,971 dan Random Forest sebesar 0,963, 0,976, 0,980. Hasil penelitian tanpa menggunakan seleksi fitur dengan algoritma Decision Tree dan Random Forest sebesar 0.982 dan 0.987. Hasil analisis menunjukan dengan adanya seleksi fitur akan berpengaruh pada hasil dari akurasi setiap algoritma dimana pada penelitian ini justru menghasilkan akurasi yang lebih buruk dibandingkan tanpa seleksi fitur.


Keywords


random forest;decision tree;PCA;seleksi fitur

References


S. F. Putra, R. Pradina, and I. Hafidz, “Feature Selection pada Dataset Faktor Kesiapan Bencana pada Provinsi di Indonesia Menggunakan Metode PCA (Principal Component Analysis),” J. Tek. ITS, vol. 5, no. 2, 2016, doi: 10.12962/j23373539.v5i2.16035.

D. Jain and V. Singh, “An Efficient Hybrid Feature Selection model for Dimensionality Reduction,” Procedia Comput. Sci., vol. 132, no. Iccids, pp. 333–341, 2018, doi: 10.1016/j.procs.2018.05.188.

R. Adhao and V. Pachghare, “Feature selection using principal component analysis and genetic algorithm,” J. Discret. Math. Sci. Cryptogr., vol. 23, no. 2, pp. 595–602, 2020, doi: 10.1080/09720529.2020.1729507.

Z. Wu, W. Lin, Z. Zhang, A. Wen, and L. Lin, “An Ensemble Random Forest Algorithm for Insurance Big Data Analysis,” Proc. - 2017 IEEE Int. Conf. Comput. Sci. Eng. IEEE/IFIP Int. Conf. Embed. Ubiquitous Comput. CSE EUC 2017, vol. 1, pp. 531–536, 2017, doi: 10.1109/CSE-EUC.2017.99.

Suyanto, Machine Learning Tingkat Dasar dan Lanjut. Bandung: Informatika Bandung, 2018.

A. S. Khazari, F. Marisa, and I. D. Wijaya, “Sistem Rekomendasi Penentuan Judul Skripsi Menggunakan Algoritma Decision Tree,” J. Teknol. dan Manaj. Inform., vol. 3, no. 1, 2017, doi: 10.26905/jtmi.v3i1.1248.

N. Antonio, A. de Almeida, and L. Nunes, “Hotel booking demand datasets,” Data Br., vol. 22, pp. 41–49, 2019, doi: 10.1016/j.dib.2018.11.126.

N. António, A. de Almeida, and L. Nunes, “Predictive models for hotel booking cancellation: a semi-automated analysis of the literature,” Tour. Manag. Stud., vol. 15, no. 1, pp. 7–21, 2019, doi: 10.18089/tms.2019.15011.


Refbacks

  • There are currently no refbacks.


Copyright (c) 2021 Senamika

Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.