Abstract :
Pada era modern, musik tidak dapat dipisahkan dari kehidupan manusia. Masyarakat dapat dengan bebas mengakses musik kesukaannya melalui berbagai platform digital seperti YouTube, Spotify dan Apple Music yang menawarkan beragam fitur di dalamnya. Salah satu fiturnya merupakan rekomendasi musik. Fitur rekomendasi musik merupakan hasil pengembangan dari ranah penelitian Music Information Retrieval (MIR) yaitu salah satu penelitiannya adalah klasifikasi genre musik. Pada ranah klasifikasi, genre musik rawan mengandung label noise karena genre musik sendiri merupakan label pemberian manusia untuk mendeskripsikan musik. Noise pada ranah klasifikasi dapat mengakibatkan hubungan fitur-fitur terhadap label menjadi samar yang dapat mengakibatkan proses klasifikasi menjadi overfit. Kondisi overfit menggambarkan bahwa model klasifikasi tidak mampu menangkap pola data secara general yang dalam hal ini apabila terdapat data musik baru, maka performa model klasifikasi tidak akan baik. Tujuan dari penelitian ini adalah mengimplementasikan model klasifikasi yang mampu menanggulangi kondisi overfitting pada ranah klasifikasi genre musik. Penentuan model terpilih dengan algoritma XGBoost dilakukan dengan melakukan proses grid search untuk menentukan parameter Shrinkage dan Gamma optimal, yaitu model yang menghasilkan nilai akurasi yang tinggi namun memiliki perbedaan nilai training log-loss dan test log-loss relatif kecil. Model terpilih memiliki nilai shrinkage v=0,63 dan gamma γ=1,2. Perbandingan dilakukan terhadap model terpilih dan model default untuk melihat kontribusi gamma terhadap kompleksitas model. Model default dengan nilai gamma γ=0 terindikasi kondisi overfit karena memiliki nilai train log-loss yang relatif rendah dibandingkan dengan train log-loss model terpilih namun memiliki nilai test log-loss yang relatif lebih tinggi dibandingkan dengan model terpilih. Artinya, model terpilih yang menggunakan nilai gamma pada model terpilih mampu mengatasi kondisi overfitting. Tingkat akurasi keseluruhan pada modl terpilih adalah sebesar 66,67% dengan sensitivity untuk genre Country, Pop, dan Rock masing-masing adalah 70,58%,66,7% dan 62,5%