Semantic Extraction and Representation of Web Documents Based on Domain Ontology

Arifah Che Al-Hadi; Lailatul Qadri Zakaria; Shahrul Azman Mohd Noah; Tengku Mohd Tengku Sembok

Authors

Arifah Che Al-Hadi Jabatan Sains Komputer Fakulti Sains dan Teknologi Universiti Malaysia Terengganu
Lailatul Qadri Zakaria Jabatan Sains Maklumat Fakulti Teknologi dan Sains Maklumat Universiti Kebangsaan Malaysia
Shahrul Azman Mohd Noah Jabatan Sains Maklumat Fakulti Teknologi dan Sains Maklumat Universiti Kebangsaan Malaysia
Tengku Mohd Tengku Sembok Jabatan Sains Maklumat Fakulti Teknologi dan Sains Maklumat Universiti Kebangsaan Malaysia

Keywords:

Perwakilan semantik dokumen, pengekstrakan maklumat semantik, ontologi, analisis bahasa tabii.

Abstract

Internet menjadi pilihan sebagai prasarana asas bagi mendapatkan maklumat digital pelbagai topik dari seluruh dunia. Namun demikian kebanyakan dokumen web dalam Internet ini adalah tidak berstruktur dan tidak mempunyai maklumat semantik dokumen. Sistem pengekstrakan maklumat yang ada lebih memfokuskan kepada pengekstrakan konsep penting dalam mewakili kandungan dokumen tanpa mengambil kira aspek semantik. Perwakilan kandungan maklumat dalam bentuk kaya semantik merupakan salah satu visi web semantik. Kertas ini membincangkan pengaplikasian pendekatan ontologi dan pemprosesan bahasa tabii dalam menyokong pengekstrakan dan perwakilan maklumat semantik dokumen web. Memandangkan penganotasian maklumat semantik secara manual daripada dokumen web adalah tidak praktikal dan pembangunan sistem automatik sepenuhnya masih terlalu awal untuk diimplementasikan, maka pendekatan separa-automatik telah diusulkan. Dalam hal ini, sistem berfungsi untuk memandu pengguna dalam pemodelan semantik dokumen web yang seterusnya menghasilkan kandungan dokumen web atau set dokumen web yang lebih kaya semantik. Model semantik yang dijana diwakilkan dalam format XML.

Semantic Extraction and Representation of Web Documents Based on Domain Ontology

Authors

Keywords:

Abstract

Downloads

Issue

Section

License

Developed By

Information