Rough Data Set Discretization Using Boolean Reasoning
Authors
Rokiah @ Rozita Ahmad
Fakulti Sains dan Teknologi
Universiti Kebangsaan Malaysia
Maslina Darus
Fakulti Sains dan Teknologi
Universiti Kebangsaan Malaysia
Siti Mariyam Shamsuddin
Fakulti Sains Komputer dan Teknologi Maklumat
University Teknologi Malaysia
Azuraliza Abu Bakar
Fakulti Teknologi dan Sains Maklumat
Universiti Kebangsaan Malaysia
Abstract
Pendiskretan data set kasar terhadap nilai nyata atribut merupakan salah satu aspek yang paling penting di dalam konsep pelombongan data, terutamanya yang melibatkan masalah pengkelasan masalah. Hasil kajian secara empirik menunjukkan bahawa kualiti pengkelasan bergantung kepada algoritma pendiskretan yang digunakan di dalam fasa pra-pemprosesan input data. Oleh yang sedemikian, proses pendiskretan boleh dinyatakan sebagai satu operasi gelidahan partisi terhadap domain atribut ke dalam bentuk selang dan menggabungkan nilai tersebut ke atas setiap selang yang berkaitan. Proses pendiskretan melibatkan gelidahan terhadap potongan yang menentukan selang berkaitan. Kesemua nilai yang berada pada setiap selang tersebut dipetakan terhadap nilai yang sama, iaitu menukarkan nilai atribut berkaitan kepada satu nilai berangka, yang boleh dijadikan sebagai atribut simbolik. Gelidahan terhadap potongan dilaksanakan terhadap perwakilan dalaman integer bagi input sistem keputusan. Kertas kerja ini bertujuan mengupas peranan set kasar dalam pendiskretan data menggunakan ta'akulan Boolean yang melakukan proses penukaran nilai nyata simbol matematik bercetak ke dalam perwakilan yang lebih mudah untuk menghasilkan kadar pencaman yang lebih baik menggunakan rangkaian neural.