Deteksi Trending Topik Terkait Covid-19 Pada Tweet Bahasa Indonesia Menggunakan Metode Maximum Capturing

Prasetyo Ariwibowo, Indra Indra

Abstract


Twitter merupakan layanan jejaring sosial yang sering digunakan sebagai sumber informasi, seperti topik mengenai Covid-19. Banyaknya informasi yang terdapat pada tweet terkadang terdapat informasi yang sudah lampau dan tidak penting. Oleh karena itu diperlukan sebuah trending topics agar memudahkan mengetahui informasi terbaru dan yang sedang banyak dibicarakan oleh masyarakat. Pada penelitian ini membangun sistem untuk mendeteksi trending topics pada sosial media Twitter. Dataset yang digunakan sebanyak 500 data tweet. Sistem yang dibuat menggunakan metode Maximum Capturing untuk membentuk suatu klaster dengan perhitungan Jaccard Similarity sebagai penentuan nilai kesamaan antar tweet yang digunakan dalam pembentukan klaster. Dari klaster yang terbentuk diproses menggunakan Algoritme Apriori sebagai penentuan frequent itemset yang hasilnya sebagai kumpulan kata trending topics. Dalam pengujian menggunakan 12 data ground truth dengan membandingkan keterkaitan topik pada sebuah media berita online, yaitu Kompas.com yang menghasilkan nilai topic recall = 58.3%, keyword precission = 66.6%, dan keyword recall = 83.3%.


Keywords


Twitter; Trending Topics; Klasterisasi

References


BA. N. Assidyk et al., “Analisis Perbandingan Pembobotan TF-IDF dan TF-RF pada Trending Topic di Twitter dengan Menggunakan Klasifikasi K-Nearest Neighbor,” vol. 7, no. 2, pp. 7773–7781, 2020.

F. Atefeh and W. Khreich, “A survey of techniques for event detection in Twitter,” Comput. Intell., vol. 31, no. 1, pp. 133–164, 2015, doi: 10.1111/coin.12017.

E. B. Setiawan, D. H. Widyantoro, and K. Surendro, “Feature expansion using word embedding for tweet topic classification,” Proceeding 2016 10th Int. Conf. Telecommun. Syst. Serv. Appl. TSSA 2016 Spec. Issue Radar Technol., no. 2011, 2017, doi: 10.1109/TSSA.2016.7871085.

R. Rafif, E. B. Setiawan, and I. Kurniawan, “Analisis dan implemenasi algoritma C4 . 5 dan pembobotan TF-IDF untuk menentukan trending topik pada media sosial twitter,” vol. 7, no. 2, pp. 7661–7672, 2020.

E. De Santis, A. Martino, and A. Rizzi, “An Infoveillance System for Detecting and Tracking Relevant Topics from Italian Tweets during the COVID-19 Event,” IEEE Access, vol. 8, pp. 132527–132538, 2020, doi: 10.1109/ACCESS.2020.3010033.

A. Madani, O. Boussaid, and D. E. Zegour, “Real-time trending topics detection and description from Twitter content,” Soc. Netw. Anal. Min., vol. 5, no. 1, pp. 1–13, 2015, doi: 10.1007/s13278-015-0298-5.

W. Zhang, T. Yoshida, X. Tang, and Q. Wang, “Text clustering using frequent itemsets,” ELSEVIER Knowledge-Based Syst., vol. 23, no. 5, pp. 379–388, 2010, doi: 10.1016/j.knosys.2010.01.011.

M. A. Bianto, S. Rahayu, M. Huda, and Kursini, “Perancangan Sistem Pendeteksi Plagiarisme Terhadap Topik Penelitian Menggunakan Metode K-Means Clustering Dan Model Bayesian,” Semin. Nas. Teknol. Inf. dan Multimed., pp. 19–24, 2018.

G. Pradnyana and A. Djunaidy, “Metode Weighted Maximum Capturing Untuk Klasterisasi Dokumen Berbasis Frequent Itemsets,” J. Ilmu Komput., vol. 6, no. 2, pp. 1–10, 2013.

Sunardi, A. Yudhana, and I. A. Mukaromah, “Implementasi Deteksi Plagiarisme Menggunakan Metode N-Gram Dan Jaccard Similarity Terhadap Algoritma Winnowing,” Transmisi, vol. 20, no. 3, p. 105, 2018, doi: 10.14710/transmisi.20.3.105-110.

R. Agrawal and R. Srikant, “A fast algorithm for mining association rules,” in Proceedings of the IEEE International Conference on Software Engineering and Service Sciences, ICSESS, 1994, pp. 513–516, doi: 10.1109/ICSESS.2014.6933618.

S. Syarif, Anwar, and Dewiani, “Trending topic prediction by optimizing K-nearest neighbor algorithm,” Proc. 2017 4th Int. Conf. Comput. Appl. Inf. Process. Technol. CAIPT 2017, vol. 2018-Janua, pp. 1–4, 2018, doi: 10.1109/CAIPT.2017.8320711.

L. Kurniawati, A. E. Kusuma, and B. Dewansyah, “Implementasi Algoritma Apriori Untuk Menentukan,” CESS (Journal Comput. Eng. Syst. Sci., vol. 4, no. 1, pp. 6–10, 2019.


Refbacks

  • There are currently no refbacks.


Copyright (c) 2022 Senamika

Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.