Abstract :
Sebagai bagian dari UNESCO Global Geopark (UGG), wisata Geopark Ciletuh memiliki praktisi Public Relations (PR) yang mempunyai tujuan dalam hal membangun, mengembangkan, dan mempertahankan reputasi serta citra dari kawasan wisata Geopark Ciletuh. Untuk mencapai tujuan tersebut, prak?tisi PR melakukan media monitoring dengan mencari dan memilih berita dari berbagai sumber media online, lalu mengumpulkannya kedalam kliping berita
untuk diidentifikasi dan dianalisis. Dalam media monitoring, proses ini disebut data back-end. Penelitian ini mengusulkan focused crawling untuk diimplemen?tasikan pada data back-end media monitoring Geopark Ciletuh supaya proses pengumpulan data lebih cepat. Focused crawling diimplementasikan dengan
menggunakan tiga metode yaitu metode crawler dengan Algoritma Breadth First Search (BFS) untuk mendapatkan URL berita yang lebih banyak, metode distiller dengan Topic-Specific Weight Table dan Page Relevance untuk fitur parameter dataset, serta metode klasifikasi dengan Multinomial Naive Bayes untuk menentukan berita yang relevan. Hasil penelitian dengan algoritma BFS dapat melakukan crawling sebanyak 470 URL untuk Detik dan 290 URL untuk Kompas. Sedangkan dalam menentukan berita yang relevan akurasi yang dida?patkan model Multinomial Naive Bayes dengan Page Relevance yaitu 83.46% untuk dataset Detik, 89% untuk dataset Kompas dan diatas 88.16% untuk kedua gabungan dataset Detik dan Kompas.