Multitemporale Landbedeckungsklassifikation von Satellitenbildern für Aufgaben der Landesvermessung
Team: | M. Voelsen, F. Rottensteiner, C. Heipke |
Jahr: | 2019 |
Förderung: | Landesamt für Geoinformation und Landesvermessung Niedersachsen (LGLN) |
Laufzeit: | 2019 - 2025 |
Durch die Verfügbarkeit großer Mengen an Satellitenbild-Zeitreihen (SITS) ist die Beobachtung der Erdoberfläche mit hoher zeitlicher Auflösung möglich. Eine der grundlegenden Aufgaben besteht in der pixelweisen Klassifikation der Landbedeckung, d.h. der Identifizierung des physischen Materials der Erdoberfläche in einem Bild. Aktuell erfolgreiche Methoden diese Aufgabe mithilfe eines überwachten Ansatzes zu lösen, basieren auf künstlicher Intelligenz, wie beispielsweise Fully Convolutional Neural Networks (FCNs) oder Transformer.
Das wesentliche Ziel dieses Projektes ist die Nutzung von Sentinel-Bilddaten für die automatische Aktualisierung und Ergänzung der Geodatenbanken der niedersächsischen Vermessungsverwaltung (LGLN), insbesondere im Hinblick auf Landbedeckung und Landnutzung. Während dies bisher auf Grundlage von Luftbildern erfolgt, die alle drei Jahre erfasst werden, soll die Aktualisierung nun auf der pixelweisen Klassifizierung der verfügbaren Satellitenbild-Zeitreihen basieren, die alle 5-6 Tage für den Sentinel-2-Satelliten erfasst werden. Die Sentinel-Daten werden von der Europäischen Weltraumorganisation (ESA) im Rahmen des Copernicus-Programms seit mehreren Jahren kontinuierlich erhoben und kostenlos zur Verfügung gestellt.
Für die pixelweise Klassifikation werden (FCNs) verwendet, die durch die räumlichen Faltungen (Convolutions) vor allem die räumlichen Merkmale aus den Bildern extrahieren. Darüber hinaus wird die zeitliche Dimension in den Klassifikationsprozess einbezogen, d. h. eine Zeitreihe dient als Eingabe für den Klassifikator, der für jeden Eingabezeitschritt auch eine Ausgabe liefert. Für die Extraktion von zeitlichen Merkmalen sind Transformer Modelle ebenfalls eine geeignete Modellart, da sie Abhängigkeiten zwischen Eingabesequenzen beliebiger Länge extrahieren können, die unabhängig vom Abstand der Bilder in der Eingabesequenz sind. Aus diesen Gründen kombinieren wird in diesem Projekt Transformer-Modelle mit einem FCN, um sowohl räumliche als auch zeitliche Merkmale zu extrahieren. Die für diese Methode benötigten Trainingsdaten werden aus bestehenden Geodaten des LGLN gewonnen, die mit zeitlich passenden Satellitendaten kombiniert werden