@thesis{thesis, author={Matulatan Tekad and Novia Hidayati Nuraisa and RAIF M IRFAN}, title ={OTOMATISASI PENDETEKSI KATA BAKU DAN TIDAK BAKU PADA DATA TWITTER BERBASIS KBBI MENGGUNAKAN METODE LEXICON-BASED}, year={2024}, url={http://repositori.umrah.ac.id/7752/}, abstract={Berdasarkan Kamus Besar Bahasa Indonesia (KBBI), penelitian ini berkonsentrasi pada pembuatan sistem deteksi otomatis yang dapat membedakan kata baku dan tidak baku dalam data Twitter. Penelitian ini sangat penting untuk menjamin komunikasi yang efektif karena Twitter adalah platform media sosial yang sering menggunakan kata-kata yang tidak baku karena terdapat batasan pengunaan kata. Melalui normalisasi kata-kata tidak baku, penelitian ini membantu preprocessing dan analisis tweet, yang merupakan langkah penting dalam klasifikasi teks media sosial. Sistem otomatis yang dikembangkan oleh penelitian ini tidak hanya memudahkan peneliti untuk mengidentifikasi penggunaan kata-kata slang atau tidak baku, tetapi juga meningkatkan kualitas komunikasi dan pemahaman pesan dalam tweet yang mengikuti tren bahasa terbaru. Penelitian ini menggunakan metode lexicon-Based untuk kamus opini, mengumpulkan data, melakukan preprocessing, menemukan bahasa yang tidak baku, menemukan slang, dan menghapus kata berimbuhan. Metode ini membantu analisis sentimen dalam pengolahan teks dan memastikan bahwa hasil klasifikasi sentimen pada data Twitter lebih akurat. Hasil percobaan menunjukkan bahwa langkah preprocessing meningkatkan akurasi metode penentuan polarisasi secara efektif, Tingkat accuracy InSet adalah 66,66% dan F1-score adalah 61,40%.} }