Computer-Assisted Understanding of Stance in Social Media

Formalizations, Data Creation, and Prediction Models

Universität Duisburg-Essen

Sprache:

Michael Wojatzki

Michael Wojatzki hat seine Promotion im Januar 2019 am Graduiertenkolleg "User-Centred Social Media" der Universität Duisburg-Essen abgeschlossen. Neben seiner akademischen Laufbahn war Michael für mehrere Firmen im Informationsmanagment und in der Softwareentwicklung tätig. Seine Forschung beschäftigt sich mit automatischen, KI-gestützten Verfahren, die in den in sozialen Medien geteilte Meinungen erkennen und analysieren.

Auf einen?

Expertise

  • Data Science
  • Künstliche Intelligenz (machine learning)
  • Meinungsanalyse / Meinungsforschung

Interessant für

  • Data Scientists
  • Informatiker
  • Social Media Manager
  • Meinungsforscher
Pietro Jeng/Unsplash
Michael Wojatzki

Michael Wojatzki hat seine Promotion im Januar 2019 am Graduiertenkolleg "User-Centred Social Media" der Universität Duisburg-Essen abgeschlossen. Neben seiner akademischen Laufbahn war Michael für mehrere Firmen im Informationsmanagment und in der Softwareentwicklung tätig. Seine Forschung beschäftigt sich mit automatischen, KI-gestützten Verfahren, die in den in sozialen Medien geteilte Meinungen erkennen und analysieren.

Auf einen?

Expertise

  • Data Science
  • Künstliche Intelligenz (machine learning)
  • Meinungsanalyse / Meinungsforschung

Interessant für

  • Data Scientists
  • Informatiker
  • Social Media Manager
  • Meinungsforscher

Interview

Anja Zeltner
Freie Autorin

Was bedeutet der Ausdruck „Stance“ im Social-Media-Kontext?

Michael Wojatzki
schreibt…
Anja Zeltner
Freie Autorin

Was bedeutet der Ausdruck „Stance“ im Social-Media-Kontext?

Michael Wojatzki
Doktorand

„Stance“ – zu Deutsch „Haltung“, „Position“ oder „Standpunkt“ – bezeichnet die positive oder negative Evaluation von Personen, Dingen oder Ideen. Der Stance von Menschen bringt sie dazu, eine bestimmte Partei oder einen bestimmten Kandidaten zu wählen, ein bestimmtes Produkt zu kaufen oder bestimmte Menschen zu vermeiden oder aufzusuchen. Da Menschen heutzutage ihren Stance weithin über soziale Medien zum Ausdruck bringen, können die sozialen Medien als wichtige Quelle dazu dienen, den Stance von Gruppen oder der Gesellschaft als Ganzem einzuschätzen. Wenn die Menge an der zum Ausdruck gebrachten Positionen aussagekräftig verarbeitet und verstanden werden kann, können Regierungen, Unternehmen oder andere Entscheider wertvolle Einblicke darüber erhalten, wie Menschen ihre Entscheidungen oder Produkte bewerten und diese an die Bevölkerung oder ihre Nutzer anpassen.

Anja Zeltner
Freie Autorin

Du hast untersucht, ob man Vorhersagen darüber treffen kann, wie sich Menschen zu kontroversen Themen positionieren, z. B. zu Klimawandel oder Gender-Equality. Was waren deine Ergebnisse?

Michael Wojatzki
Doktorand

Es ist tatsächlich möglich, solche Vorhersagen zu treffen. Allerdings müssen dafür zwei Voraussetzungen gegeben sein: Erstens sind Daten vonnöten, mit denen das System, das die Analyse vornimmt, „trainieren“ kann. Diese Daten können zum Beispiel dadurch erhalten werden, dass Menschen zum Beispiel relevante Facebook-Posts mögen. Zweitens sind die zur Vorhersage genutzten Modelle immer themenspezifisch. Das heißt wenn man ein Modell trainiert hat, welches Positionen zum Thema „Klimawandel“ vorhersagt, so kann es nicht ohne weiteres für das Thema „Genderequality“ genutzt werden. Selbst unter diesen Bedingungen ist es sehr schwierig, die Position von Individuen vorherzusagen. Die Schwierigkeit für Computer ist hier, dass Individuen oft widersprüchliche Positionen vertreten – es zum Beispiel unmoralisch finden, Fleisch zu essen, es aber trotzdem tun. Vorhersagen auf Basis einer größeren Menge an Menschen können hingegen mit hoher Wahrscheinlichkeit getroffen werden. Dabei wird dann untersucht, was für ein Prozentsatz einer Gruppe mit Positionen übereinstimmt oder diese ablehnt.

Anja Zeltner
Freie Autorin

Wie kann die Analyse von Haltungen in sozialen Medien eine Gesellschaft positiv oder negativ beeinflussen?

Michael Wojatzki
Doktorand

Maschinen, die automatisch Stance in großem Umfang verstehen können, haben großes Potenzial, aber sie können auch gefährlich für eine Gesellschaft werden. Etwa dann, wenn Leute Stance-Erfassung allein dazu nutzen, um mit Inhalten zu interagieren, die mit ihren eigenen Positionen übereinstimmen. So werden existierende Echokammern noch verstärkt und Diskurse über kontroverse Themen – die eigentlich alle Mitglieder einer Gesellschaft miteinander führen sollten – finden nicht statt. Dies kann letztendlich zu einer zersplitterten Gesellschaft führen, in der kein Konsens mehr möglich ist. Zudem bietet Stance-Erfassung die technische Basis für eine allumfassende Zensur oder die Verfolgung von politischen Dissidenten. Gleichzeitig kann automatische Stance-Erfassung die Effizienz steigern, in der Nutzer von sozialen Medien oder Organisationen Posts entdecken oder filtern, die wiederum einen Stance ausdrücken in Bezug auf Zielsetzungen, an denen sie interessiert sind. Auf diese Weise kann automatische Stance-Erfassung einer Gesellschaft als Ganzes helfen, effizienter zu kommunizieren und so bessere Entscheidungen zu treffen.

Schlagworte

Soziale Medien, Stance

Zusammenfassung

Stance (dt: Haltung, Position oder Standpunkt) bezeichnet die positive oder negative Evaluation von Personen, Dingen oder Ideen (Du Bois, 2007). Versteht man den Stance, den Menschen in den sozialen Medien zum Ausdruck bringen, eröffnen sich vielfältige Anwendungsmöglichkeiten: Auf der einen Seiten können Regierungen, Unternehmen oder andere Informationssuchende Einblicke darüber gewinnen, wie Menschen ihre Entscheidungen, Ideen oder Produkte bewerten. Auf der anderen Seite können Social Media Nutzer, denen der Stance anderer Nutzer bekannt ist, effizientere Diskussionen führen und letztendlich bessere kollektive Entscheidungen treffen.

Da die Anzahl der in sozialen Medien getätigter Beiträge zu hoch für eine manuelle Analyse ist, sind computergestützte Methoden zum Verständnis von Stance notwendig. In dieser Arbeit untersuchen wir drei Hauptaspekte solcher computergestützten Methoden: (i) abstrakte Stance Formalisierungen, die sich über mehrere Social Media Beiträge hinweg quantifizieren lassen, (ii) die Erstellung geeigneter Datensätze, die einer bestimmten Formalisierung entsprechen, und (iii) automatische Systeme zur Erkennung von Stance, die Social Media Beiträgen ein Stance Label zuordnen können. Wir untersuchen vier verschiedene Formalisierungen, die sich darin unterscheiden, wie spezifisch die Erkenntnisse sind, welche sie bei der Analyse von Social Media Debatten liefern: Stance gegenüber einzelnen Targets definiert Stance als ein Tupel, welches aus einem einzigen Target (z.B. Atheismus) und einer Polarität (z.B. für oder gegen das Target sein) besteht. Stance gegenüber mehreren Targets modelliert eine Polarität, die gegenüber einem übergeordneten Target und mehreren logisch verknüpften Targets ausgedrückt wird. Stance gegenüber nuancierten Targets, modelliert Stance als eine Polarität gegenüber allen Texten in einem bestimmten Datensatz. Darüber hinaus untersuchen wir hasserfüllten Stance als eine Formalisierung, die modelliert, ob ein Text Hass gegenüber einem einzelnen Target (z.B. Frauen oder Flüchtlingen) ausdrückt.

Systeme, die auf Methoden des maschinellen Lernens basieren, benötigen eine ausreichende Menge von mit Labeln versehenen Trainingsdaten. Da solche Daten nicht für jede Formalisierung verfügbar sind, wurden im Rahmen dieser Arbeit eigene Datensätze erstellt. Auf der Basis dieser Datensätze führen wir quantitative Analysen durch, welche Aufschluss darüber geben, wie zuverlässig die Annotation der Daten ist und in welcher Weise Social Media-Nutzer Stance kommunizieren. Unsere Analyse zeigt, dass die Zuverlässigkeit unserer Daten durch subjektive Interpretationen der Annotatoren und durch die Häufigkeit, mit der bestimmte Targets auftreten, beeinflusst wird. Unsere Studien zeigen weiterhin, dass die Wahrnehmung von Hass mit dem persönlichen Stance der Annotatoren korreliert, woraus wir folgern, dass Stance Annotationen bis zu einem gewissen Grad subjektiv sind und dass diese Subjektivität bei der Datenerstellung zukünftig berücksichtigt werden sollte. Darüber hinaus schlagen wir einen neuartigen Prozess für die Erstellung von Datensätzen vor, die subjektive Annotationen beinhalten, die der Formalisierung Stance gegenüber nuancierten Targets entsprechen und damit umfassende Einblicke in die zugrundeliegende Social Media Debatte liefert.

Um den Stand der Technik der automatischen Stance Erkennung zu untersuchen, haben wir relevante shared tasks organisiert und an ihnen teilgenommen, sowie Experimente an eigenen Datensätzen durchgeführt. Unsere Untersuchungen zeigen über alle Experimente und Datensätze hinweg, dass vergleichsweise einfache Methoden eine äußerst wettbewerbsfähige Leistung erbringen. Des Weiteren zeigen unsere Betrachtungen, dass neuronale Ansätze zwar wettbewerbsfähig, aber nicht deutlich besser als herkömmliche Ansätze zur Textklassifizierung sind. Wir zeigen, dass Ansätze, die auf der Beurteilungsähnlichkeit basieren – definiert als das Ausmaß mit dem Texte von einer großen Anzahl von Menschen ähnlich beurteilt werden – die Leistung von Referenzansätzen deutlich übertreffen. Daraus schließen wir, dass diese Beurteilungsähnlichkeit eine vielversprechende Richtung ist, um weitere Verbesserungen in den Bereichen automatischen Erkennung von Stance und verwandten Aufgaben wie Sentimentanalyse oder Argument Mining zu erzielen.

Volltext auf OpenD

Diese Dissertation ist auf OpenD im Volltext verfügbar. Online und OpenAccess.

Jetzt lesen

Zitiervorschlag

Wojatzki, Michael Maximilian. Computer-Assisted Understanding of Stance in Social Media: Formalizations, Data Creation, and Prediction Models. Universität Duisburg-Essen, 2019, doi:10.17185/duepublico/48043.

Repository

duepublico.uni-duisburg-essen.de

Identifikatoren

urn:nbn:de:hbz:464-20190201-140926-6

doi: 10.17185/duepublico/48043