Institusion
Universitas Bina Darma
Author
M. EDO, NOPRIAN
Edi Surya, Negara
Subject
QA75 Electronic computers. Computer science
Datestamp
2021-08-05 02:13:38
Abstract :
Pesatnya perkembangan dalam dunia informasi digital menyebabkan peningkatan volume informasi yang berbentuk teks seperti dokumen berita. Di sosial media dokumen berita sangat banyak di unggah dalam rentan waktu yang begitu cepat dan salah satunya adalah Twitter. Twitter adalah layanan sosial media yang sudah sangat banyak melayani pengguna sehingga menjadikannya sebagai salah satu sosial media yang memiliki data yang sangat besar. Dari data yang sangat besar tersebut dapat dimanfaatkan sebagai sumber dokumen berita untuk web berita online. Akan tetapi dengan banyaknya topik yang di ektraksi pada data Twitter membuat data yang masuk memiliki beragam topik yang menyebabkan kesulitan dalam mengidentifikasi topik dari kumpulan data yang diambil dan akan Membutuhkan waktu yang banyak jika harus dilakukan secara manual oleh manusia. Sedangkan, data tersebut berpotensi dibutuhkan untuk memberikan informasi secepat mungkin.Dengan dilakukannya penelitian ini, bertujuan untuk mengklasifikasikan topik pada data yang diambil dari Twitter secara otomatis sehingga dapat membuat klasifikasi pada dokumen berita yang diambil,dapat lebih efektiv dan efesien dan tidak membutuhkan waktu sebanyak dilakukan manual oleh manusia. Penelitian dilakukan dengan metode Latent Dirichlet Allocation (LDA). Dokumen berita yang akan di klasifikasi adalah dokumen berita bahasa Indonesia dan akan di klasifikasikan kedalam topik yang akan ditentukan. Eksperimen pemodelan topik dengan metode LDA menyimpulkan bahwa jumlah topik yang didbentuk dari 9094 data tweet adalah 10 topik. Hasil eksperimen ini Latent Dirichlet Allocaion dapat digunakan untuk text mining, tetapi data tweet yang dihasilkan belum layak untuk dijadikan informasi dalam pengambilan topik berita. Karena hasil dari metode ini masih membutuhkan peninjauan kembali oleh manusia untuk mengetahui fakta dari topic yang dihasilkan.