Please use this identifier to cite or link to this item: https://repository.uksw.edu//handle/123456789/29039
Title: Perbandingan Metode Decision Tree dan Metode Logistic Regression untuk Klasifikasi Pada Data Genetik Single Nucleotide Polymorphism
Other Titles: Comparison Of The Decision Tree Method And Logistic Regression To Classification Genetic Single Nucleotide Polymorphism
Authors: Purnalia, Febi Setivani Dita
Keywords: Decision Tree;Klasifikasi;R;Logistic Regression
Issue Date: 13-Jan-2023
Abstract: Penelitian ini dilakukan dengan menggunakan dua metode klasifikasi yaitu metode decision tree dan metode logistic regression. Decision tree merupakan salah satu metode pada teknik klasifikasi dalam data mining. Pada metode decision tree sampel data yang sangat besar akan direpresentasikan menjadi aturan yang lebih kecil, dan logistic regression merupakan salah satu metode yang bertujuan untuk mengetahui pengaruh suatu variabel independen terhadap variabel lain yaitu dependen dikotomi. Kedua algoritma ditulis dan dianalisis menggunakan perangkat lunak R guna melihat metode mana yang lebih baik antara metode decision tree dan metode logistic regression yang diterapkan pada data genetik SNP (Single Nucleotide Polymorphism) yang diperoleh dari data Asthma, SNP merupakan suatu perbedaan susunan basa nukleotida tunggal pada genom suatu individu yang menyebabkan adanya variasi genetik pada suatu populasi. Basa nukleotida penyusun genom manusia memiliki kesamaan yang mencapai 99,9% dan hanya 0,1% nukleotida yang membedakan antar individu. Melalui kedua metode ini analisis perbandingan dilakukan berdasarkan dari hasil nilai akurasi yang diperoleh pada kedua metode tersebut yang dilakukan dengan menggunakan variasi proporsi data uji bertutut-turut sebesar 40%, 30%, 20% dan 10% kemudian dilakukan simulasi sebanyak 1000 kali dengan alasan untuk memperoleh nilai akurasi yang lebih akurat karena hasil yang diperoleh dapat berubah-ubah setiap kali dilakukan percobaan. Dari hasil yang diperoleh menunjukkan bahwa pada metode decision tree memperoleh nilai akurasi adalah 0,5745 sedangkan pada metode logistic regression yaitu 0,7763 dan dicapai pada proporsi data uji 20%. Dengan demikian dapat disimpulkan bahwa pada kasus ini metode logistic regression memperoleh hasil yang lebih baik daripada metode decision tree dalam klasifikasi pada data genetik single nucleotide polymorphism.
This research was conducted using two classification methods, namely the decision tree method and the logistic regression method. Decision tree is one method of classification techniques in data mining. In the decision tree method, very large data samples will be represented as smaller rules, and logistic regression is a method that aims to determine the effect of an independent variable on other variables, namely the dependent dichotomy. Both algorithms were written and analyzed using R software to see which method is better between the decision tree method and the logistic regression method applied to SNP (Single Nucleotide Polymorphism) genetic data obtained from Asthma data, SNP is a difference in the arrangement of single nucleotide bases in genome of an individual that causes genetic variation in a population. The nucleotide bases that make up the human genome have a similarity of up to 99.9% and only 0.1% of the nucleotides differentiate between individuals. Through these two methods a comparative analysis is carried out based on the results of the accuracy values obtained in the two methods which are carried out using variations in the proportion of successive test data of 40%, 30%, 20% and 10% then a simulation is carried out 1000 times with the reason for obtain a more accurate accuracy value because the results obtained can change each time an experiment is carried out. The results obtained show that the decision tree method obtains an accuracy value of 0.5745 while the logistic regression method is 0.7763 and is achieved at the proportion of test data of 20%. Thus it can be concluded that in this case the logistic regression method obtained better results than the decision tree method in classifying single nucleotide polymorphism genetic data.
URI: https://repository.uksw.edu//handle/123456789/29039
Appears in Collections:T1 - Mathematics

Files in This Item:
File Description SizeFormat 
T1_662019015_Judul.pdf470.34 kBAdobe PDFView/Open
T1_662019015_Bab I.pdf
  Until 9999-01-01
240.97 kBAdobe PDFView/Open
T1_662019015_Bab II.pdf
  Until 9999-01-01
411.67 kBAdobe PDFView/Open
T1_662019015_Bab III.pdf
  Until 9999-01-01
253.1 kBAdobe PDFView/Open
T1_662019015_Bab IV.pdf
  Until 9999-01-01
398.16 kBAdobe PDFView/Open
T1_662019015_Bab V.pdf
  Until 9999-01-01
171.63 kBAdobe PDFView/Open
T1_662019015_Daftar Pustaka.pdf299.18 kBAdobe PDFView/Open
T1_662019015_Lampiran.pdf
  Until 9999-01-01
325.4 kBAdobe PDFView/Open
T1_662019015_Lisensi dan Embargo.pdf
  Restricted Access
659.12 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.