5

Netzlexikon B wie Bilderkennung

Bilder wie auf LSD! Drogenrausch aus dem Rechner! Den gibt es, wenn man die neueste Bilderkennungssoftware in einen Wolkenhimmel starren lässt. Aber die Drogenbilder sind nur ein hübscher Nebeneffekt, die digitale Bilderkennung hat ganz andere Einsatzgebiete.

Von: Florian Meyer-Hawranek

Stand: 23.06.2015 | Archiv

Bilderkennungssoftware auf der Suche nach erkennbaren Motiven | Bild: BR

Wie funktioniert eigentlich Bilderkennung?

Um zum Beispiel einen Schnappschuss vom Abendessen mit Freunden auch wirklich als solchen zu erkennen, reicht es nicht, dass ein Algorithmus die vollen Teller erfasst und der Rechner anschließend den Haufen Nudeln als Tagliatelle mit Jakobsmuscheln identifiziert: Erst im Kontext mit anderen, richtig ermittelten Objekten - der brennenden Kerze, den Weingläsern oder den entspannten Gesichtern im Dämmerlicht - kann ein Computer der Szene den Stempel "Abendessen mit Freunden" aufdrücken.

Wie schaffen Rechner das?

Digitale Bilderkennung und die damit eng verbundene automatische Bildverarbeitung sind eines der kompliziertesten Gebiete der Informatik. Immerhin geht es darum, Objekte erst eindeutig zu identifizieren und sie dann in den richtigen Zusammenhang zu stellen. Die dafür notwendigen Programme sind aufwendig und die Berechnungen so vielschichtig, dass Informatiker auf ein ganzes Netzwerk an Informations- und Entscheidungsquellen zurückgreifen: Sogenannte Input-Knoten analysieren einen Impuls, also ein Merkmal, wie die Farbe eines Gegenstands, und leiten den Eindruck dann an einen übergeordneten Knotenpunkt weiter - ähnlich wie menschliche Nervenzellen. Deshalb heißt der digitale Überbau der Bilderkennung neuronales Netzwerk.

Aber wie erkennen die digitalen Nerven-Bündel jetzt, was auf meinen Handy-Bildern zu sehen ist?

Die digitale Bilderkennung funktioniert über mehrere Schichten von Netzen, die nacheinander ein Bild betrachten. In den fortgeschrittensten Analysen sind das bis zu 30 verschiedene Erkennungsschritte. Um zu identifizieren, was auf einem Foto ist, zerlegt eine Schicht das Bild zum Beispiel in mehrere kleine Teile. Danach suchen andere Schichten nach Farben, Linien oder Ecken und später auch nach einzelnen Bauteilen - wie den Augen oder Ohren auf einem Katzenbild. Die letzte Schicht des neuronalen Netzes schweißt die Elemente dann zusammen, interpretiert und entscheidet, was auf dem Foto zu sehen ist.

Und wie entscheiden die Rechner, was sie sehen?

Neuronale Netzwerke kann man trainieren. Um zu zeigen, wie sie arbeiten, haben Google-Forscher ihre Tools jetzt in die umgekehrte Richtung rechnen lassen: Die Computer haben quasi in den Himmel gestarrt und den Programmierern gesagt, was sie in den Wolken sehen. Die Informatiker verstärkten dafür einfach die einzelnen neuronalen Schichten und übertrugen die überzogenen Bildinterpretationen der Maschinen wieder zurück auf die Bilder. Das Ergebnis sind psychedelische Kunstwerke, krasse Drogenbilder voller wilder Kreaturen, die in einem bunten Durcheinander an Wolken, Seen und Bäumen stecken. Ganz so, als ob ein Menschen auf einem Trip ist und das Gehirn die komischsten Dinge in den Himmel malt.

Wenn Computer am Ende Situationen automatisch erkennen können, dann wird Überwachung ja noch umfassender!

Klar. Und damit wird nicht nur der Datenschutz, sondern auch die Kontrolle über die IT-Infrastruktur der automatischen Bilderfasser und Situationsversteher immer wichtiger. Gesichtserkennung funktioniert schon jetzt ziemlich gut. Wer wann wo auf einem Foto oder Video zu erkennen ist, lässt sich anhand der Metadaten schon jetzt sagen. Die Erkennungssoftware will aber noch mehr. Forscher arbeiten zum Beispiel bereits daran, automatisch Tätowierungen zu erfassen und einer Gang zuzuordnen. Das FBI leckt sich danach schon die Finger.


5