@thesis{thesis, author={Arifah Fildzah Adra}, title ={PENERAPAN SISTEM DATA CLEANING DALAM MASTER DATA DENGAN MENGGUNAKAN ALGORITMA DUPLICATE COUNT STRATEGY (STUDI KASUS: PT XYZ)}, year={2021}, url={http://repository.bakrie.ac.id/5386/}, abstract={Adanya permasalahan berupa duplikasi data dalam sebuah master data, peneliti melakukan penerapan sistem untuk data cleaning yang dapat mendeteksi duplikasi data pada master data konsumen Divisi Consumer Care PT XYZ. Dalam penelitian ini digunakan algoritma untuk mendeteksi duplikasi data yaitu dengan menerapkan pendekatan metode Duplicate Count Strategy (DCS++) dan N-Gram. Sistem data cleaning diperuntukan bagi Sales Admin agar mempermudah dalam menemukan duplikasi data. Selain itu, sistem ini juga dibuat untuk merapikan format penulisan telepon dan fax yang ada pada master data konsumen Divisi Consumer Care PT XYZ. Penerapan ini dibangun dengan menggunakan bahasa pemrograman C#. Hasil dari penerapan sistem data cleaning yang dibangun akan dinilai seberapa efektif metode DCS++ dan N-Gram dengan menghitung nilai recall dan precision dalam mendeteksi duplikasi data.} }