DETAIL DOCUMENT
OTOMATISASI PENDETEKSI KATA BAKU DAN TIDAK BAKU PADA DATA TWITTER BERBASIS KBBI MENGGUNAKAN METODE LEXICON-BASED
Total View This Week0
Institusion
Universitas Maritim Raja Ali Haji
Author
RAIF, M IRFAN
Matulatan, Tekad
Novia Hidayati, Nuraisa
Subject
005.1.Pemrograman 
Datestamp
2024-07-31 02:23:48 
Abstract :
Berdasarkan Kamus Besar Bahasa Indonesia (KBBI), penelitian ini berkonsentrasi pada pembuatan sistem deteksi otomatis yang dapat membedakan kata baku dan tidak baku dalam data Twitter. Penelitian ini sangat penting untuk menjamin komunikasi yang efektif karena Twitter adalah platform media sosial yang sering menggunakan kata-kata yang tidak baku karena terdapat batasan pengunaan kata. Melalui normalisasi kata-kata tidak baku, penelitian ini membantu preprocessing dan analisis tweet, yang merupakan langkah penting dalam klasifikasi teks media sosial. Sistem otomatis yang dikembangkan oleh penelitian ini tidak hanya memudahkan peneliti untuk mengidentifikasi penggunaan kata-kata slang atau tidak baku, tetapi juga meningkatkan kualitas komunikasi dan pemahaman pesan dalam tweet yang mengikuti tren bahasa terbaru. Penelitian ini menggunakan metode lexicon-Based untuk kamus opini, mengumpulkan data, melakukan preprocessing, menemukan bahasa yang tidak baku, menemukan slang, dan menghapus kata berimbuhan. Metode ini membantu analisis sentimen dalam pengolahan teks dan memastikan bahwa hasil klasifikasi sentimen pada data Twitter lebih akurat. Hasil percobaan menunjukkan bahwa langkah preprocessing meningkatkan akurasi metode penentuan polarisasi secara efektif, Tingkat accuracy InSet adalah 66,66% dan F1-score adalah 61,40%. 
Institution Info

Universitas Maritim Raja Ali Haji