DSpace logo

Please use this identifier to cite or link to this item: http://repository.uksw.edu/handle/123456789/16197
Title: Klasifikasi Halaman Web Menggunakan Metode TF-IDF SVM pada Sistem Terdistribusi Multinode Cluster
Authors: Saelau, Kwang Dharma
Issue Date: 2016
Publisher: Program Studi Teknik Elektro FTEK-UKSW
Abstract: Dengan semakin bertambah besarnya jumlah data dan halaman web di internet, semakin diperlukan pula sebuah web crawler yang memiliki efisiensi dan ketepatan dalam mencari sumber informasi yang diharapkan. Salah satunya adalah dengan memakai focused web crawler. Dalam skripsi ini diusulkan sebuah focused web crawler yang diimplementasikan pada sebuah sistem terdistribusi Hadoop Multinode Cluster dengan metode TF-IDF SVM. Perancangan focused web crawler dengan sistem ini untuk mempercepat penelusuran halaman web, meningkatkan presisi dan akurasi topik serta meringankan proses kerja penelusuran. Pada pengujian topik halaman web yang ditelusuri, digunakan 10 topik yaitu smartphone, banjir, bisnis, NBA(basket), olimpiade, pendidikan, pokemon, Portugal, sepak bola dan puasa. Crawler yang dirancang ini dapat menelusuri halaman web dengan kecepatan rata-rata 8,698 detik per halaman. Kemudian crawler ini juga memiliki precision 86,37% dan recall 66,68%.
With increasingly large amounts of data and web pages on the internet, the more necessary is also a web crawler that have high efficiency and accuracy in finding resources is expected. One of them is to use a focused web crawler. In this thesis proposed a dedicated web crawler which is implemented in a distributed system Multinode Hadoop Cluster with TF-IDF SVM method. Design a dedicated web crawler with this system to speed up searches web pages, improving the precision and accuracy of topics as well as ease the work process search. On testing the topic of the web pages searched, used 10 areas including smartphones, flooding, businesses, NBA (basketball), Olympic games, education, pokemon, Portugal, football and fasting. Crawler designed it can browse web pages with an average speed of 8,698 seconds per page. Then the crawler also has precision 86,37% and 66,68% recall.
Description: Tidak diijinkan karya tersebut diunggah ke dalam aplikasi Repositori Perpustakaan Universitas dikarenakan tidak dibubuhkan cap fakultas di scan lembar pengesahan.
URI: http://repository.uksw.edu/handle/123456789/16197
Appears in Collections:T1 - Electrical Engineering

Files in This Item:
File Description SizeFormat 
T1_612012016_BAB I.pdf
  Restricted Access
BAB I302.58 kBAdobe PDFView/Open Request a copy
T1_612012016_BAB II.pdf
  Restricted Access
BAB II769.57 kBAdobe PDFView/Open Request a copy
T1_612012016_BAB III.pdf
  Restricted Access
BAB III646.74 kBAdobe PDFView/Open Request a copy
T1_612012016_BAB IV.pdf
  Restricted Access
BAB IV403.94 kBAdobe PDFView/Open Request a copy
T1_612012016_BAB V.pdf
  Restricted Access
BAB V235.64 kBAdobe PDFView/Open Request a copy
T1_612012016_Daftar Pustaka.pdf
  Restricted Access
Daftar Pustaka228.9 kBAdobe PDFView/Open Request a copy
T1_612012016_Judul.pdfHalaman Judul1.35 MBAdobe PDFView/Open
T1_612012016_Lampiran.pdf
  Restricted Access
Lampiran1.19 MBAdobe PDFView/Open Request a copy


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.