Freitag, 22. August 2025

TerraMind: Neues multimodales KI-Modell zur Erdbeobachtung

TerraMind ist ein generatives Open-Source-KI-Modell, das speziell für die Analyse von Erdbeobachtungsdaten entwickelt wurde. Es wurde von europäischen Forschungsteams unter Federführung des DLR (Deutsches Zentrum für Luft- und Raumfahrt) im Rahmen des FAST-EO-Projekts realisiert und kürzlich veröffentlicht. Der Fokus liegt auf der Verknüpfung unterschiedlicher Datentypen (z.B. optische und Radar-Satellitenbilder, geografische Merkmale, Text) in einer gemeinsamen Modellarchitektur.

Technische Details

TerraMind basiert auf einer neuartigen Transformer-Architektur, die gleichzeitig auf zwei Skalen arbeitet: auf Pixelebene und auf Token-Ebene. Dabei werden pixelbasierte Daten (z.B. Bilder) und tokenbasierte Daten (z.B. Zahlen, Wörter, Positionskoordinaten) gemeinsam verarbeitet. Konkret nutzt TerraMind einen symmetrischen Encoder-Decoder-Transformer, der Pixel-Embeddings und sprachähnliche Token-Embeddings kombiniert, um Korrelationen über alle Modalitäten hinweg zu erlernen.

Für das Training wurde das Erdbeobachtungs-Datenset TerraMesh verwendet, eine eigens im Projekt erstellte multimodale Datenbasis. TerraMesh enthält über 9 Millionen räumlich und zeitlich ausgerichtete Beispiele mit insgesamt rund 500 Milliarden Tokens. Die Daten decken neun Kernmodalitäten ab, darunter optische Sentinel-2-Aufnahmen, SAR-Daten von Sentinel-1, digitale Höhenmodelle (DEM), Landnutzungs- und Vegetationskarten sowie einfache geografische Beschreibungen. 

Beteiligung des EOC

Das Earth Observation Center (EOC) des DLR war maßgeblich an der Entwicklung von TerraMind beteiligt. Im Rahmen des FAST-EO-Konsortiums, geleitet von DLR/IMF und finanziert durch die ESA Φ-Lab, arbeiteten Forscher von DLR, dem Forschungszentrum Jülich, IBM Research Europe und KP Labs zusammen. Der EOC stellte dabei Expertise in satellitengestützte Erdbeobachtung und Datenanalytik bereit.

Leistung und Effizienz

TerraMind übertrifft laut Pressemitteilungen ältere Geo-KI-Modelle deutlich in den Leistungsbenchmarks. In Vergleichen auf dem Community-Standard-Benchmark PANGAEA erzielte TerraMind in Aufgaben wie Landbedeckungsklassifikation, Veränderungserkennung und Multi-Modal-Analysen rund 8 % höhere Genauigkeit als die bisher besten Modelle. Gleichzeitig ist TerraMind ungewöhnlich rechen- und energieeffizient und benötigt etwa zehnmal weniger Rechenaufwand als herkömmliche Einzel-Modell-Ketten.

Open-Source-Verfügbarkeit

TerraMind wurde von IBM und ESA als Open-Source-Projekt veröffentlicht. Die Modellgewichte (Version 1.0, Base- und Large-Variante) stehen auf Hugging Face zur Verfügung. Die zugehörigen Trainingsdatensätze (TerraMesh) sind ebenfalls frei zugänglich. Für Entwickler gibt es ein GitHub-Repository von IBM mit Beispielcode, Konfigurationsdateien und Jupyter-Notebooks für Feintuning und Inferenz. Die Lizenz ist Apache 2.0.

Relevanz und Anwendungen

TerraMind bietet neue Möglichkeiten in der Erdbeobachtung und Umweltüberwachung durch die integrative Nutzung vielfältiger Datenquellen. Typische Anwendungsfelder sind:
- Landnutzungs- und Vegetationsmonitoring
- Wasser- und Dürremanagement
- Katastrophenvorsorge
- Land- und Forstwirtschaft
- Infrastruktur- und Stadtplanung

Schlussfolgerung

TerraMind stellt einen bedeutenden Fortschritt für KI-gestützte Erdbeobachtung dar. Es vereint multimodale Datenverarbeitung, generative KI und effiziente Architektur zu einem flexiblen Tool, das in Leistungstest bisherige Modelle übertrifft, dabei aber deutlich weniger Ressourcen benötigt. Die offene Verfügbarkeit fördert die Zusammenarbeit in der Geo-Community und eröffnet neue Möglichkeiten, globale Umwelt- und Klimadaten präziser auszuwerten.

Quellen

Angaben basieren auf Projektseiten und Veröffentlichungen von DLR/EOC, IBM, ESA und FAST-EO. Weitere Details finden sich im TerraMind-Preprint sowie in den Open-Source-Repositorien auf Hugging Face und GitHub.

Keine Kommentare:

Kommentar veröffentlichen