Please use this identifier to cite or link to this item:
https://repository.uksw.edu//handle/123456789/12142
Title: | Sistem Peringkas Berita Otomatis Berbasis Text Mining Menggunakan Generalized Vector Space Model: Studi Kasus Berita Diambil dari Media Massa Online |
Authors: | Wangsa, Budhi Kurniawan |
Issue Date: | 2014 |
Publisher: | Program Studi Sistem Komputer FTEK-UKSW |
Abstract: | Salah satu informasi yang sangat banyak dicari saat ini adalah berita. Berita yang dicari lebih diinginkan jika dalam bentuk yang sudah diringkas. Peringkasan membutuhkan pengembangan algoritma baru dan tentu saja membutuhkan pencarian yang lebih terarah ke sumber berita dari media massa online yang menggunakan Bahasa Indonesia dan juga media massa online yang terpercaya.
Focused crawler adalah solusi pencarian berita yang terarah karena focused crawler melihat isi dari suatu halaman web untuk menilai apakah halaman web tersebut sesuai atau tidak dengan konteks pencarian. Metode generalized vector space model (GVSM) adalah metode untuk menilai tingkat kemiripan tiap kalimat terhadap suatu topik dokumen. Dengan metode GVSM ini dapat diketahui kalimat mana yang lebih berbobot terhadap suatu dokumen sehingga dapat dilakukan peringkasan dengan memperhatikan tingkat kemiripan kalimat.
Dari hasil perancangan dan pengujian didapat tingkat kesuksesan focused crawler sebesar 53% sementara dari kuesioner hasil ringkasan menggunakan metode GVSM dinilai secara rata-rata 2,71 dari skala 1-4 oleh empat puluh orang responden. Sistem mampu meringkas sebanyak 754 berita dari 797 berita yang didapat atau sekitar 94% dari berita yang didapat. Sehingga didapat kesimpulan bahwa sistem yang dirancang mampu mencari berita secara terarah sekaligus meringkas berita dengan hasil yang dapat diterima. News is becoming one of the most important information. Currently, news is preferred to be found in a simplified form. The simple form of news is summary. In case of search and summarizer all news in Indonesian trustworthy online mass media automatically a new algorithm and system must be developed. Focused crawler is a solution for a directional search in case of news collecting from online mass media because focused crawler is able to judge whether the news page is relevant not only from the title but also from the content. Generalized vector space model (GVSM) is a method to judge similarity of each sentence to the document topic. Using GVSM method the similarity coefficient of each sentence can be known and sentences with low rate of similarity coefficient can be cut. The results of development and testing of this system are the success rate for focused crawler search and rating for summarizer result. The success rate for focused crawler search is 53% and summary that’s resulted from GVSM method is rated 2.7 from scale 1-4 by forty respondents. The system can summarize 754 of 797 news. That is about 94% from the total collected news. It can be concluded that this system can search and summarize the news automatically as a solution to the problem. |
Description: | Tidak diijinkan karya tersebut diunggah ke dalam aplikasi Repositori Perpustakaan Universitas dikarenakan masih ada kekurangan administrasi. |
URI: | http://repository.uksw.edu/handle/123456789/12142 |
Appears in Collections: | T1 - Computer Systems |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
T1_622009005_BAB I.pdf Restricted Access | BAB I | 581.72 kB | Adobe PDF | View/Open |
T1_622009005_BAB II.pdf Restricted Access | BAB II | 849.11 kB | Adobe PDF | View/Open |
T1_622009005_BAB III.pdf Restricted Access | BAB III | 832.47 kB | Adobe PDF | View/Open |
T1_622009005_BAB IV.pdf Restricted Access | BAB IV | 1.47 MB | Adobe PDF | View/Open |
T1_622009005_BAB V.pdf Restricted Access | BAB V | 150.07 kB | Adobe PDF | View/Open |
T1_622009005_Daftar Pustaka.pdf Restricted Access | Daftar Pustaka | 234.12 kB | Adobe PDF | View/Open |
T1_622009005_Judul.pdf | Halaman Judul | 1.84 MB | Adobe PDF | View/Open |
T1_622009005_Lampiran 1.pdf Restricted Access | Lampiran 1 | 122.42 kB | Adobe PDF | View/Open |
T1_622009005_Lampiran 2.pdf Restricted Access | Lampiran 2 | 379.07 kB | Adobe PDF | View/Open |
T1_622009005_Lampiran 3.pdf Restricted Access | Lampiran 3 | 207.09 kB | Adobe PDF | View/Open |
T1_622009005_Lampiran 4.pdf Restricted Access | Lampiran 4 | 792.94 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.