Konfrontationen zur Bundespräsidentenwahl 2016
Nachdem seit den
Sommergesprächen schon eine gewisse Infrastruktur zur Gesprächsauswertung vorhanden ist, kann man diese auch auf die Konfrontationen im Rahmen der Bundespräsidentenwahl anwenden. Somit hier nun der (erneute) Versuch einer halbwegs automatischen Gesprächsauswertung.
Dies ist keine Inhaltsanalyse im wissenschaftlichen Sinn. Die automatisierte Auswertung von - noch dazu gesprochener - Sprache ist recht komplex und fehleranfällig (siehe unten). Die folgenden Daten sollten nicht als letztgültig gesehen werden, sondern mehr als Spielerei, Anspruch auf Fehlerfreiheit gibt es ohnehin nicht. Die Debatten wurden wieder dankenswerter Weise von
neuwal.com transkribiert.
Eckdaten
Zum Einstieg ein paar Eckdaten: Die Antwortlänge beider Kandidaten in dieser Diskussion war ähnlich, Van der Bellen verwendet etwas mehr unterschiedliche Worte. Der Gesprächsanteil verteilt sich konstant gleichmäßig (berechnet ohne Moderation).
Gesprächsverlauf
Die Grafik reiht Fragen (dunkelgrau) und Antworten (grün/blau) aneinander, die Breite der Blöcke entspricht der Länge der jeweiligen Aussage (in Zeichen). Trotz teils langer Antworten gibt es quer zum Gespräch immer wieder kurze Diskussionen zwischen und Einwürfe von beiden Kandidaten.
häufigste Begriffe
Die Balken zeigen die absolute Häufigkeit der in den Antworten vorkommenden Begriffe. Der "enge Filter" entfernt Begriffe ohne offensichtliche Aussagekraft, wie "schon", "werden" oder "sein", ebenso Formulierungen des persönlichen Gesprächs, wie "ich", "ja" oder "glauben" ("Ja, ich glaube, dass..."). Ein Klick auf den jeweiligen Balken ruft die entsprechenden Stellen im Gespräch auf, das "x" entfernt den Begriff aus der Reihung.
Alexander Van der Bellen (oe24.tv)
Norbert Hofer (oe24.tv)
Alexander Van der Bellen (PULS4)
Norbert Hofer (PULS4)
Alexander Van der Bellen (ATV)
Norbert Hofer (ATV)
Alexander Van der Bellen (ORF)
Norbert Hofer (ORF)
enger Filter
nur Hauptwörter
Überschneidungen und exklusive Worte
Die beiden Balken zeigen jeweils eine Art "Wortschatz" der Kandidaten. Links bzw. rechts sind jene Worte abgebildet, die nur von einem der Kandidaten verwendet wurden, in der Mitte die Überschneidungen (wenig überraschend mit Begriffen wie "ich", "sagen", "Wahl"). Die Worte im Tooltip sind nach Frequenz geordnet, es werden nur Worte mit mehr als einer Erwähnung angezeigt.
Wer wen und was wann anspricht
Noch eine andere Darstellung: Die untenstehende Säule reiht die Antworten der Kandidaten aneinander (chronologisch von oben nach unten, ohne Moderation, skaliert nach Antwortlänge). Hervorgehoben sind jeweils die Antworten, in denen z.B. die Diskutanten ihr jeweiliges Gegenüber namentlich erwähnen oder ein bestimmtes Thema ansprechen.
Dabei gibt es viele Überschneidungen, aber auch Begriffe, die trotz der zeitlichen Nähe nur in einer Debatte angesprochen werden. Sehr viel wird über Europa gesprochen, Österreich-Bezüge gibt es ebenfalls zahlreiche, besonders in der letzten Debatte sind die "Lüge"-Vorwürfe etwas eskaliert. Die Darstellung hängt freilich von den verwendeten Schlüsselwörtern ab, die Themen nicht perfekt erfassen können.
Ansprache des Gegenüber
Österreich
Europa
TTIP/CETA
Arbeit/Wirtschaft
Internationales
Türkei
Islam
Wahl&Wahlkampf
Hinweise auf Rhetorik
"Establishment"
"Lüge"
Begriffe quer zu allen Debatten
Abschließend eine Auswertung über alle vier Debatten hinweg: Die folgende Grafik zeigt jene Hauptwörter, die vom jeweiligen Kandidaten in jeder einzelnen Diskussion gebraucht wurden. Fährt man mit der Maus über einen Kreis, dann werden zusätzlich die Worte eingeblendet, die in der Nähe dieser Begriffe (=gleicher Satz) vorgekommen sind. Dazwischen kennzeichnen Linien ebenso, welche Hauptwörter im selben Satz aufgetaucht sind, was zumindest eine gewisse Nähe andeutet. Die Kreisgröße steht für die Häufigkeit des Begriffs insgesamt (öffnet aus Platz- und Performance-Gründen in einem extra Fenster - Achtung, kann in manchen Browsern rechenintensiv sein).
Alexander Van der Bellen

Norbert Hofer

Technisches
Ein paar technische Anmerkungen: Eine automatische Textanalyse setzt in vielen Aspekten voraus, dass ein gewisses Textverständnis etabliert wird. Will man etwa Häufigkeiten zählen geht es banal darum, gleiche Wörter in verschiedenen Abwandlungen (z.B. "wählen" und "wählt") zu erkennen. Das kann besser oder schlechter funktionieren, hängt aber vor allem mit einem wachsenden Wortschatz als Basis zusammen. Hier wird ein eigens gebildeter Wortschatz verwendet, der mit jedem neuen Gespräch "besser" werden sollte. Die jetzigen Daten können sich entsprechend noch ändern.
Die Auswertung erfordert auch direkte Eingriffe: Es ist sinnvoll, sehr häufige Worte wie "der die das" (so genannte stop words) von vorneherein zu entfernen, um inhaltlich wertvollere Begriffe nach vorne zu holen. Die Grenzziehung ist beliebig: Was macht man mit "ich, du, wir"? Für sich genommen sagen sie wenig aus, umgekehrt lässt sich gerade aus der Verwendung von "ich" oder "wir" ein Rückschluss auf die Sprache der Person ziehen.
Konfrontationen zur Wiederholung der Bundespräsidenten-Stichwahl am 4. Dezember 2016, Transkripte von
neuwal.com. Webscraping und die Textaufbereitung erfolgt mit
Python, die Darstellungen mit
D3. Der force-directed-graph (das Netzwerk) basiert auf
diesem Beispiel. Die verwendeten stopwords sind
hier einsehbar.
Alle Daten CC BY 4.0.