Web Documents Classification in Malaysia Stock Exchange: The Support Vector Machine Approach
Authors
Mohd Shahizan Othman
Fakulti Sains Komputer dan Sistem Maklumat
Universiti Teknologi Malaysia
Lizawati Mi Yusuf
Fakulti Sains Komputer dan Sistem Maklumat
Universiti Teknologi Malaysia
Juhana Salim
Fakulti Teknologi & Sains Maklumat
Universiti Kebangsaan Malaysia
Zarina Shukur
Fakulti Teknologi & Sains Maklumat
Universiti Kebangsaan Malaysia
Keywords:
Pengelasan, Support Vector Machine, Organisasi Maklumat
Abstract
Perkhidmatan Internet yang semakin mudah dicapai telah membawa kepada peningkatan bilangan laman web yang drastik. Fenomena ini telah menimbulkan masalah baru untuk enjin carian dan penstrukturan sumber maklumat web. Enjin carian semasa telah didapati menghasilkan terlalu banyak maklumat yang tidak relevan dan pautan yang hilang. Direktori Internet dan carian topik yang khusus pula, mampu menghasilkan keputusan yang lebih berkualiti berbanding enjin carian. Walau bagaimanapun, proses pembinaan dan penyelenggaraannya melibatkan kos yang tinggi kerana melibatkan penggunaan tenaga pakar untuk mengelaskan sumber maklumat. Jadi, kaedah pengelasan data yang tepat dan berkesan amat diperlukan untuk membolehkan maklumat yang berkualiti dapat dicapai. Kertas kerja ini membincangkan tentang kajian terhadap pengelasan laman web syarikat di Papan Utama dan Kedua, Bursa Malaysia menggunakan pendekatan Support Vector Machine (SVM). Hasil kajian menunjukkan pengelasan dokumen web menggunakan kernel linear mencatatkan peratusan ketepatan pengelasan yang terbaik.