Implementasi Text Mining Klasifikasi Topik Tugas Akhir Mahasiswa Teknik Informatika Menggunakan Pembobotan TF-IDF dan Metode Cosine Similarity Berbasis Web

Nila Andriani, Arief Wibowo

Abstract


Pembuatan tugas akhir sebelumnya perlu ditentukan topik yang diambil. Masalah dalam penentuan topik sebuah skripsi adalah diperlukan pemahaman terkait isi dokumen dikarenakan topik dalam skripsi terdapat kategori berbeda, maka diperlukan sistem yang dapat melakukan pengklasifikasian agar pengetahuan terkait topik diketahui dengan cepat dan tepat. Implementasi dari penelitian ini bertujuan untuk dapat mengkategorikan topik skripsi secara komputerisasi atau otomatis menggunakan TF-IDF dan metode Cosine Similarity serta penggunaan sample data skripsi mahasiswa Teknik Informatika Universitas Budi Luhur. Selanjutnya data tersebut akan diproses dengan perhitungan mencari bobot terhadap kata dengan mengalikan banyaknya kata yang dicari dengan Inversed Document Frequency. Setelah perhitungan TF/IDF dan menemukan nilai bobotnya, kemudian menghitung similaritas dengan metode cosine similarity. Hasil dari perhitungan cosine similarity ditampilkan dalam bentuk persentase. Berdasarkan hasil pengujian pada datalatih dan data uji menghasilkan persentase sebesar 86,66%, dengan demikian disimpulkan bahwa metode cosine similarity mendeteksi tingkat similaritas dengan hasil yang cukup baik dan tepat.


Keywords


Algoritma Cosine Similarity, Perhitungan TF-IDF, Dokumen Skripsi

References


N. Suri, “Bab II Landasan Teori,” J. Chem. Inf. Model., vol. 53, no. 9, pp. 1689–1699, 2019.

A. Nurhadi, “Implementasi Algoritma Naïve Bayes Classifier Berbasis Particle Swarm Optimization (PSO) Untuk Klasifikasi Konten Berita Digital Berbahasa Indonesia,” J. Speed, vol. 5, no. 3, pp. 7–12, 2016, [Online]. Available: http://ejurnal.net/portal/index.php/speed/article/view/799/730.

E. L. Amalia, A. J. Jumadi, I. A. Mashudi, and D. W. Wibowo, “Analisis Metode Cosine Similarity Pada Aplikasi Ujian Online Otomatis (Studi Kasus JTI POLINEMA),” J. Teknol. Inf. dan Ilmu Komput., vol. 8, no. 2, p. 343, 2021, doi: 10.25126/jtiik.2021824356.

A. Salam, J. Zeniarja, and R. S. U. Khasanah, “Analisis Sentimen Data Komentar Sosial Media Facebook Dengan K-Nearest Neighbor (Studi Kasus Pada Akun Jasa Ekspedisi Barang J&T Ekpress Indonesia),” Pros. SINTAK, pp. 480–486, 2018.

S. Sugiyamto, B. Surarso, and A. Sugiharto, “Analisa Performa Metode Cosine Dan Jacard Pada Pengujian Kesamaan Dokumen,” J. Masy. Inform., vol. 5, no. 10, pp. 1–8, 2014, doi: 10.14710/jmasif.5.10.1-8.

S. S. Mohammad Khoiron and Adhi Dharma Wibawa, Microblogging Analysis for Determining Public Policy Priority based on Public Opinion using Naïve Bayes and Analytical Hierarchy Process Algorithm, vol. 5, no. 1. 2016.

H. F. Fadli and A. F. Hidayatullah, “Identifikasi Cyberbullying pada Media Sosial Twitter Menggunakan Metode LSTM dan BiLSTM,” Automata, 2021, [Online]. Available: https://journal.uii.ac.id/AUTOMATA/article/view/17364.

L. W. Astuti, A. Rachmat C., and Y. Lukito, “Implementasi Algoritma Naïve Bayes Menggunakan Isear Untuk Klasifikasi Emosi Lirik Lagu Berbahasa Inggris,” J. Inform., vol. 14, no. 1, pp. 16–21, 2017, doi: 10.9744/informatika.14.1.16-21.

A. Afriza and J. Adisantoso, “Metode Klasifikasi Rocchio untuk Analisis Hoax Rocchio Classification Method for Hoax Analysis,” J. Ilmu Komput. Agri-Informatika, vol. 5, pp. 1–10, 2018, [Online]. Available: http://journal.ipb.ac.id/index.php/jika.

M. D. R. Wahyudi, “Penerapan Algoritma Cosine Similarity pada Text Mining Terjemah Al-Qur’an Berdasarkan Keterkaitan Topik,” Semesta Tek., vol. 22, no. 1, pp. 41–50, 2019, doi: 10.18196/st.221235.


Refbacks

  • There are currently no refbacks.


Copyright (c) 2022 Senamika

Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.