Implementasi Scraping Google Scholar Menggunakan HTML DOM Untuk Pengumpulan Data Artikel Dosen UPN Veteran Jakarta Berbasis Web

Azini Fauzia Putri, Geyessella Manik, Farhana Nabila, Nurul Chamidah

Abstract


Google Cendekia atau biasa disebut Google Scholar adalah situs pencarian literatur yang berdiri pada tahun 2004. Bagi civitas academica terutama bagi dosen UPN Veteran Jakarta, melakukan publikasi penelitian merupakan hal yang penting. Untuk menilai kinerja penelitian diperlukan suatu website yang berisi khusus publikasi artikel ilmiah para dosen yang dapat melakukan rekapitulasi publikasi artikel yang telah disitasi dari Google Scholar. Pemilihan situs Google Scholar karena data karya ilmiah telah terdokumentasi secara lengkap, Adapun proses pengembangan web dilakukan dengan menggunakan model classic life cycle atau biasa disebut dengan waterfall yang terdiri atas empat langkah yaitu analisa keperluan sistem, desain, penyusunan kode, dan terakhir adalah pengujian. Penarikan data publikasi sendiri menggunakan teknik web scraping, teknik ini mempermudah dalam penarikan data-data publikasi dalam jumlah yang besar secara cepat. Scraping dilakukan dengan menggunakan bahasa pemrograman PHP dengan bantuan library Simple HTML DOM Parser yang berhasil mengambil 352 data dosen dari 7 fakultas UPN Veteran Jakarta dengan banyaknya data artikel sebesar 4.977 data artikel dosen. Data tersebut akan disimpan ke dalam database dan ditampilkan pada website yang berfungsi untuk menampilkan daftar profil dosen, judul karya ilmiah, tahun dan sitasi yang dilengkapi fitur pencarian dan sorting data sehingga memudahkan pengguna untuk melihat jumlah sitasi jurnal dan informasi lainnya.


Keywords


Google Scholar, Scraping, HTML DOM

References


Google Cendekia. (2020, September 26). Diakses pada Maret 26, 2021, dari Wikipedia: https://id.wikipedia.org/wiki/Google_Cendekia.

Triyono. (2020, April 30). Pengertian dan Manfaat Google Scholar [Halaman web]. Diakses dari https://raharja.ac.id/2020/04/30/pengertian-dan-manfaat-google-scholar.

Ayani, D. D., Partiwi, H. S., Muhardi, H. (2019). Implementasi Web Scraping untuk Pengambilan Data pada Situs Marketplace. Jurnal Sistem dan Teknologi Informasi, 7(4), 257-262.

Mitra, V., Sujaini, H., Negara, A. B. P. (2017). Rancang Bangun Aplikasi Web Scraping untuk Korpus Paralel Indonesia-Inggris dengan Metode HTML DOM. Jurnal Sistem dan Teknologi Informasi (JUSTIN), 5(1), 36-41.

Dimmay, H. M. (2016). Pengertian Database MySQL dan phpMyAdmin [Halaman web]. Diakses dari http://hadribonjay.it.student.pens.ac.id/.

Alfina, O., Harahap, F. (2019). Pemodelan UML Sistem Pendukung Keputusan dalam Penentuan Kelas Siswa Tunagrahita. Methomika: Jurnal Manajemen Informatika & Komputerisasi Akuntansi, 3(2), 143-150.

Indiyah, F. H. (2016). Pengembangan Sistem Manajemen Surat Menyurat (Masmatik) Jurusan Matematika. KNPMP I, 906-914.

Rahmatulloh, A., & Gunawan, R. (2020). Web Scraping with HTML DOM Method for Data Collection of Scientific Articles from Google Scholar. Indonesian Journal of Information Systems, 2(2), 95-104.

Komang. (2019). Web Crawler Sederhana dengan PHP Simple HTML DOM Parser [Halaman web]. Diakses dari http://komang.my.id/2019/05/14/web-crawler-sederhana-dengan-php-simple-html-dom-parser/.


Refbacks

  • There are currently no refbacks.


Copyright (c) 2021 Senamika

Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.