Selbstlernende Software analysiert Wahlprogramme

Um die Wahlprogramme der Parteien zur Bundestagswahl anschaulich aufzubereiten, hat BR Data eine Software eingesetzt, welche die Positionspapiere automatisiert auswertet. So arbeitet das selbstlernende Computerprogramm. Von Florian Regensburger

Von

Florian Regensburger

Über dieses Thema berichtet: Hintergrund am 19.09.2017 um 06:00 Uhr.

Wer sich ein wirklich genaues Bild machen will, welche Partei was zu welchem politischen Thema plant, steht vor einer Aufgabe: Neben Entscheidungshilfen wie einem Kanzlerduell im TV und Online-Tools wie dem Wahl-o-maten gibt es mehr als 700 gedruckte Seiten an Wahlprogrammen. Und das sind nur die der Parteien, die laut Umfragen bei über fünf Prozent liegen.

Die entscheidenden Aussagen herausfiltern

Warum also nicht einen Computer einsetzen, um die entscheidenden Aussagen herauszufiltern? Das haben die Datenjournalisten von BR Data versucht, mit einer selbstlernenden Computersoftware. Dieser Algorithmus hat sich durch die Programme von CDU/CSU, SPD, Linken, Grünen, FDP und AFD gearbeitet. Felix Biesmann, Experte für maschinelles Lernen, hat die Software zusammen mit BR Data entwickelt. Er erklärt den sogenannten Machine-Learning-Ansatz:

"Ein Machine-Learning-Modell ist in seinem Rohzustand erst einmal untrainiert. Aber sobald man es dann mit Daten gefüttert hat, trainiert man das. Für einfache Modelle läuft das Training normalerweise auf einem normalen Laptop in wenigen Sekunden durch." Felix Biesmann, Machine-Learning-Experte

Üben an alten Wahlprogrammen

Für die BR-Data-Analyse durfte der Machine-Learning-Algorithmus an den Partei-Papieren für deutsche Bundestagswahlen seit 1998 üben. Wenn die Software die aktuellen Wahlprogramme anschließend nach bestimmten Schlüsselwörtern durchforstet, kann sie eine Aussage darüber treffen, welchen Raum das eine oder andere Thema bei einer Partei einnimmt. Und nicht nur das: Die Software merkt auch, ob eine Partei bei Streitthemen wie zum Beispiel Sozialstaat oder innerer Sicherheit eine eher linke oder rechte Haltung vertritt.

So kann der Algorithmus nicht nur erkennen, ob jemand zum Beispiel viel über Wirtschaftspolitik schreibt. Er kann anhand der verwendeten Begriffe auch mit einiger Wahrscheinlichkeit sagen, welche wirtschaftspolitische Haltung der Text einnimmt.

Begriffe indizieren eine politische Haltung

Wörter wie "Leistung", "Belastungen" oder "Wettbewerb" deuten dabei auf eine eher wirtschaftsliberale Position hin. Die Begriffe "Löhne", "Beschäftigung" oder "Arbeitszeit" sprechen für eine eher auf Arbeitnehmerrechte ausgerichtete Politik. Doch gewisse sprachliche Feinheiten bereiten dem Algorithmus noch Schwierigkeiten. Machine-Learning-Experte Felix Biesmann:

"Eine Herausforderung bei der Arbeit mit Textdaten ist unter anderem Negation. Also man kann ja den Sinn eines Satzes mit einem einzigen 'nicht' zum Beispiel komplett verändern. Andere sprachliche Phänomene, bei denen sich Algorithmen auch sehr, sehr schwer tun, sind zum Beispiel Dinge wie Ironie. Es gibt noch kein gutes Modell, um die verschiedenen Nuancen von Humor in Sprache automatisch zu modellieren." Felix Biesmann, Machine-Learning-Experte

Ist der Algorithmus vertrauenswürdig?

Da Wahlprogramme in der Regel eher humorlos sind, fällt diese Schwierigkeit bei der aktuellen BR-Data-Analyse nicht besonders ins Gewicht. Die hat unter anderem ergeben, dass vor der Bundestagswahl fast alle Parteien etwas nach links rücken. Außerdem zeigt sich eine inhaltliche Annäherung von Union, Grünen und FDP. Doch wie weit kann man den Aussagen der Computersoftware vertrauen? Kann sie die zeitaufwendige Lektüre durch den Menschen zumindest ein Stück weit ersetzen? Dazu Pola Lehmann vom Manifesto-Projekt, das Wahlprogramme aus über 50 Ländern seit 1945 auswertet und das auch die Daten für die BR-Analyse bereitgestellt hat:

"Bei uns im Projekt, wo dasselbe Kategorienschema wie bei dem Algorithmus von Menschen umgesetzt wird, geht es immer darum, dass das Ziel einer Aussage codiert wird. Und so etwas ist tatsächlich noch schwieriger zu erfassen, weil der Algorithmus dann tatsächlich den Satz verstehen muss und wissen muss: Was ist eigentlich die dahinterstehende Idee und nicht: Was steht jetzt grade in dem Moment hier schwarz auf weiß. Aber ich denke es ist eine gute Ergänzung. Man muss sich eben vorstellen, dass nicht viele Wähler tatsächlich die Wahlprogramme lesen, sondern dass sie Informationen bekommen, die aufbereitet werden durch Medien oder andere Akteure. Und da denke ich ist es ein weiterer Zusatz, mit dem man nochmal einen Einblick bekommen kann." Pola Lehmann, Manifesto-Projekt

Eine Wahlentscheidung allein auf Grundlage der Aussagen des Algorithmus zu treffen, empfiehlt sich also eher nicht. Eine Orientierung, eine Ergänzung zur Lektüre der Wahlprogramme kann er aber durchaus bieten.