Please use this identifier to cite or link to this item: https://repository.uksw.edu//handle/123456789/32160
Title: Pengklasifikasian Pesan Elektronik Menggunakan Kombinasi Algoritma Support Vector Machine dan Grid Search
Authors: Indriawan, Fransiskus Andika
Keywords: SVM;Grid Search;Klasifikasi Spam;Spam Classification;Machine Learning
Issue Date: 4-Nov-2023
Abstract: Klasifikasi spam adalah tugas penting dalam mengidentifikasi email yang tidak diinginkan dan berpotensi membahayakan pengguna internet. Meningkatnya jumlah pengguna internet menyoroti semakin pentingnya penanganan spam secara efektif. Dalam makalah ini, kami mengusulkan sebuah pendekatan untuk klasifikasi spam menggunakan Support vector machines (SVM) dengan optimasi hyperparameter grid search. Penelitian kami berbeda dengan penelitian yang sudah ada dengan secara khusus berfokus pada integrasi SVM dengan grid search untuk mencapai tuning hyperparameter yang optimal. Selain itu, kami menyediakan dataset unik yang terdiri dari beragam sampel email spam untuk tujuan evaluasi. Kami juga menggunakan teknik pre-processing, termasuk menghilangkan kata-kata yang tidak perlu seperti stop words dan tanda baca, serta stemming kata untuk mengubah kata menjadi bentuk dasarnya. Untuk mengoptimalkan kinerja model SVM, kami menggunakan Grid Search untuk menentukan nilai optimal untuk hiperparameter, termasuk C, gamma, dan kernel. Hasil percobaan pertama menggunakan SVM dengan dataset pertama menunjukkan bahwa grid search menghasilkan parameter optimal {'C': 100, 'gamma': 0.01, 'kernel': 'rbf'}, menghasilkan peningkatan akurasi dari 98% menjadi 98.47%. Pada percobaan kedua dengan menggunakan dataset kedua, akurasi yang didapatkan adalah 99,1%, dibandingkan dengan parameter yang tidak dioptimalkan sebelumnya yang mencapai 98,8%. Hasil ini menunjukkan peningkatan yang signifikan dalam akurasi klasifikasi spam. Hasil percobaan menunjukkan bahwa pendekatan kami mengungguli metode yang sudah ada dalam hal akurasi, presisi, dan recall. Temuan penelitian kami memiliki dampak yang signifikan untuk meningkatkan sistem deteksi spam dan meningkatkan efektivitas komunikasi email secara keseluruhan.
Spam classification is an important task in identifying unwanted and potentially harmful emails for internet users. The increasing number of internet users highlights the growing importance of handling spam effectively. In this paper, we propose an approach for spam classification using Support vector machines (SVM) with grid search hyperparameter optimization. Our research differs from existing studies by specifically focusing on the integration of SVM with grid search to achieve optimal hyperparameter tuning. Additionally, we provide a unique dataset comprising diverse samples of spam emails for evaluation purposes. We also employ pre-processing techniques, including the removal of unnecessary words such as stop words and punctuation marks, as well as word stemming to convert words into their base forms. To optimize the performance of the SVM model, we use Grid Search to determine the optimal values for hyperparameters, including C, gamma, and the kernel. The results of the first experiment using SVM with the first dataset show that grid search yields the optimal parameters {'C': 100, 'gamma': 0.01, 'kernel': 'rbf'}, resulting in an accuracy improvement from 98% to 98.47%. In the second experiment using the second dataset, the accuracy obtained is 99.1%, compared to the previous non-optimized parameters which achieved 98.8%. These results indicate a significant improvement in spam classification accuracy. The experimental results demonstrate that our approach outperforms existing methods in terms of accuracy, precision, and recall. The findings of our research have significant implications for improving spam detection systems and enhancing the overall effectiveness of email communication.
URI: https://repository.uksw.edu//handle/123456789/32160
Appears in Collections:T1 - Informatics Engineering

Files in This Item:
File Description SizeFormat 
T1_672019273_Judul.pdf565.34 kBAdobe PDFView/Open
T1_672019273_Daftar Pustaka.pdf238.08 kBAdobe PDFView/Open
T1_672019273_Isi.pdf
  Until 9999-01-01
583.19 kBAdobe PDFView/Open
T1_672019273_Formulir Pernyataan Persetujuan Penyerahan Lisensi Tugas Akhir dan Pilihan Embargo.pdf
  Restricted Access
358.54 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.