Please use this identifier to cite or link to this item:
https://hdl.handle.net/20.500.14279/12748
Title: | Αξιολόγηση της απόδοσης και ευαισθησίας του ταξινομητή Random Forest για τη δημιουργία θεματικών χαρτών κάλυψης/χρήσης γης, με τη χρήση δεδομένων Sentinel-2 και Landsat-8 | Authors: | Πατσαλίδης, Σταύρος | Keywords: | Τυχαία Δάση;Sentinel 2;Landsat 8;Ταξινόμηση | Advisor: | Αγαπίου, Άθως | Issue Date: | Apr-2018 | Department: | Department of Civil Engineering and Geomatics | Faculty: | Faculty of Engineering and Technology | Abstract: | H δωρεάν διαθεσιμότητα της νέας γενιάς δεδομένων Sentinel-2, προσφέρει νέες ευκαιρίες σε εφαρμογές παρακολούθησης της γης. Συνδυαστικοί ταξινομητές όπως τα Τυχαία Δάση (Random Forest), παρουσιάζουν σημαντικές δυνατότητες στην επεξεργασία των πολυφασματικών αυτών δεδομένων και την παραγωγή θεματικών χαρτών κάλυψης γης. Ο κύριος στόχος αυτής της μελέτης, είναι η αξιολόγηση της απόδοσης και της ευαισθησίας του εν λόγο ταξινομητή στην Ανατολική Μεσόγειο, βάση των εξής κριτηρίων: τον αριθμό των δέντρων απόφασης που απαρτίζουν το δάσος, το μέγεθος του συνόλου δεδομένων που χρησιμοποιούνται για την εκπαίδευση του αλγορίθμου καθώς και το πλήθος των μεταβλητών που επιλέγονται και ελέγχονται για την εύρεση του βέλτιστου τρόπου διαχωρισμού των δεδομένων κατά την ανάπτυξη του κάθε δέντρου. Τα αποτελέσματα συγκρίνονται με ακόμα τρείς συμβατικές, παραμετρικές τεχνικές ταξινόμησης όπως η Μέγιστη Πιθανοφάνεια, η Ελάχιστη απόσταση και η απόσταση Mahalanobis, ως προς τα ίδια δεδομένα εκπαίδευσης. Συγκεκριμένα, εφαρμόστηκαν δύο διαφορετικές στρατηγικές ταξινόμησης: η πρώτη χρησιμοποιώντας άνισο και τυχαία επιλεγμένο πλήθος δεδομένων εκπαίδευσης για καθεμία από τις 11 ομάδες κάλυψης γης και η δεύτερη με τη χρήση ίσου αριθμού δεδομένων εκπαίδευσης για όλες τις κλάσεις. Τα αποτελέσματα και στις δύο περιπτώσεις ήταν παρόμοια (< 2% διαφορά) και δείχνουν ότι ο αλγόριθμος Random Forest υπερέχει σε απόδοση συγκριτικά με τους υπόλοιπους ταξινομητές, παρουσιάζοντας υψηλά ποσοστά Ολικής Ακρίβειας (90.27 %) και δείκτη Kappa (89,11%). Ακόμα, κρίθηκε αναγκαίο να εκτιμηθεί το κατά πόσο τα δεδομένα Sentinel-2, τα οποία θεωρούνται ως η συνέχεια της μακροβιότερης συλλογής δορυφορικών δεδομένων Landsat, μπορούν να παράγουν όμοια τελικά προϊόντα. Για αυτό το σκοπό, εφαρμόστηκαν οι ίδιες τεχνικές και δεδομένα εκπαίδευσης σε δεδομένα του αισθητήρα OLI από τον δορυφόρο Landsat 8. Τα αποτελέσματα δείχνουν ότι παρόλη τη φασματική ομοιότητα που υπάρχει μεταξύ τους, παρατηρείται μια διαφορά της τάξης του Ο.Α.: 2.5 % και 3 % για τον δείκτη Kappa, που γέρνει υπέρ των δεδομένων Landsat. Αυτή η διαφορά, οφείλεται αφενός στη μικρή διαφορά που υπάρχει μεταξύ της φασματικής ευαισθησίας των δύο και αφετέρου στη μεταβολή των ραδιομετρικών τιμών από την vi επανασύσταση που εφαρμόστηκε στα δεδομένα Sentinel, για να είναι χωρικά συγκρίσιμα με αυτά του Landsat. | Description: | Free availability of new generation Sentinel-2 data, offers new opportunities for land monitoring applications. Ensemble classifiers such as Random Forest, have great potential in processing this multispectral data and producing land cover thematic maps. The main objective of this study is to evaluate the efficiency and sensitivity of this classifier in the Eastern Mediterranean, based on the following criteria: the number of decision trees that make up the forest, the size of the dataset used to train the algorithm as well as the number of variables selected and tested to find the optimal way of splitting the data when growing the trees. The classification results are also compared with three conventional, parametric classification techniques such as Maximum Likelihood, Minimum Distance and Mahalanobis Distance, with respect to the same training data. Specifically, two different classification strategies were applied: the first using an uneven and randomly selected set of training data for each one of the 11 land cover classes and the second using an equal number of training data for all classes. The results in both cases were similar (< 2% difference) and show that Random Forest algorithm outperforms the other classifiers, presenting high Overall Accuracy (90.27%) and Kappa Index (89.11%). Furthermore, it was considered necessary to assess whether Sentinel-2 data, which were developed to be the sequel to the longest acquired collection of satellite data Landsat, can produce similar end-products. For this purpose, same training techniques and data were applied to OLI sensor data from the Landsat 8 satellite. The results show that despite the spectral similarity between them, there is a difference of about O.A.: 2.5% and 3% for the Kappa index, leaning towards Landsat data, due both to the small difference between the spectral sensitivity of the two and to the radiometric values distortion from the resampling applied to the Sentinel data in order to be spatially comparable to those of Landsat. | URI: | https://hdl.handle.net/20.500.14279/12748 | Rights: | Απαγορεύεται η δημοσίευση ή αναπαραγωγή, ηλεκτρονική ή άλλη χωρίς τη γραπτή συγκατάθεση του δημιουργού και κάτοχου των πνευματικών δικαιωμάτων. | Type: | Bachelors Thesis | Affiliation: | Τεχνολογικό Πανεπιστήμιο Κύπρου |
Appears in Collections: | Πτυχιακές Εργασίες/ Bachelor's Degree Theses |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Πατσαλίδης Σταύρος.pdf | 6.77 MB | Adobe PDF | View/Open |
CORE Recommender
Page view(s)
266
Last Week
0
0
Last month
4
4
checked on Dec 21, 2024
Download(s) 50
1,544
checked on Dec 21, 2024
Google ScholarTM
Check
Items in KTISIS are protected by copyright, with all rights reserved, unless otherwise indicated.