dc.description.abstract |
Kualiti udara merupakan salah satu faktor utama yang mempengaruhi keadaan
persekitaran di sesuatu kawasan. Bagi merekodkan data yang bersih dan berguna pada
perlombongan data ia memerlukan kaedah yang sesuai. Oleh yang demikian, tujuan
kajian ini dilaksanakan untuk mengenalpasti teknik terbaik untuk mengesan data tersisih
pada data pencemaran udara di Victoria Institution pada tahun 2002. Perbandingan
dilakukan pada kaedah yang berdasarkan kepada jarak (distance) iaitu teknik Manhanttan
dan kaedah berdasarkan lencongan (deviation) iaitu teknik Graf Kawalan (Control Chart)
dan teknik bermodelkan Regresi linear (Linear Regresion Model). Hasil daripada kajian
yang dilakukan, data tersisih yang dikenalpasti melalui teknik Manhanttan adalah
bergantung kepada nilai threshold yang ditetapkan iaitu semakin besar nilai threshold
maka, bilangan data tersisih yang dihasilkan adalah lebih kecil. Manakala, bagi kaedah
berdasarkan lencongan (deviation), teknik Graf Kawalan adalah lebih baik dibandingkan
dengan teknik model Regresi Linear kerana data tersisih yang dikenalpasti melalui teknik
Graf Kawalan lebih kecil daripada hasil teknik bermodelkan Regresi Linear. |
en_US |