Text
MACHINE LEARNING DETEKSI SMS SPAM DENGAN METODE NAÏVE BAYES CLASSIFIER DAN ALGORITMA TERM FREQUENCY-INVERSE DOCUMENT FREQUENCY
ABSTRAK
MACHINE LEARNING DETEKSI SMS SPAM DENGAN
METODE NAÏVE BAYES CLASSIFIER DAN
ALGORITMA TERM FREQUENCY-INVERSE
DOCUMENT FREQUENCY
Andri Gunawan
361501026
Banyaknya penyalahgunaan fitur kirim pesan singkat SMS oleh pihakpihak yang tidak bertanggung jawab dengan menyebarkan SMS spam yang tidak
diminta atau tidak diinginkan, seperti pesan penipuan, pesan porno, dan lain
sebagainya. Identifikasi SMS spam dapat dilakukan dengan dua cara yaitu dengan
pembuatan daftar hitam dan pengklasifikasian teks. Pengklasifikasian teks
merupakan cara yang lebih efisien dalam mengidentifikasi SMS spam.
Pengembangan penelitian yang menggunakan pengklasifikasian teks masih terus
dilakukan untuk mendapatkan metode yang tepat dan memiliki hasil akurasi yang
lebih baik. Pada penelitian ini, dikembang sebuah sistem untuk mengidentifikasi
SMS spam mengunakan machine learning dengan metode Naïve bayes classifier
dengan tahapan keseluruhan metode yang digunakan adalah text preprocessing
(case folding, stopword removal, punctuation remova, stemming), pembobotan
menggunakan algoritma TF-IDF serta identifikasi menggunakan metode Naïve
bayes classifier. Hasil pengujian pada penelitian ini menunjukkan
pengidentifikasian sms menggunakan metode Naïve bayes classifier dan TF-IDF
dapat mengidentifikasi SMS spam sangat baik dengan memperoleh tingkat akurasi
sebesar 80,00%.
Kata kunci: SMS spam, Identifikasi teks, Machine learning, Naïve bayes
classifier, Text preprocessing, Algoritma TF-I
Tidak tersedia versi lain