Online Magazine
Diskussionen auf Twitter analysieren

Social-Media-Daten liefern Erkenntnisse zu allen möglichen Fragen, etwa wie User in einem sozialen Medium über wichtige Themen diskutieren. Eins davon ist geschlechtsspezifische Medizin – die Berücksichtigung von Geschlechterunterschieden im Gesundheitswesen. Soziale Medien wie Twitter gelten als geeignete Plattformen, um die Diskussion zu diesem Thema auf die Allgemeinheit auszuweiten. Ist das wirklich so? Um das herauszufinden, haben wir echte Twitter-Daten analysiert.
von Katharina Batzel

Social-Media-Daten können genutzt werden, um Erkenntnisse über alle möglichen Dinge zu gewinnen. So können sie einem Unternehmen dabei helfen, geschäftsrelevante Trends zu erkennen oder herauszufinden, wie die Kunden über ihre Produkte und Dienstleistungen denken. Ebenso ermöglichen sie es Forschenden, Gespräche über gesellschaftlich wichtige Themen nachzuvollziehen. Mithilfe von Social-Media-Daten können diese analysieren, was von wem und auf welche Weise diskutiert wird.
In unserer Forschung haben wir zum Beispiel Daten von Twitter verwendet, um zu untersuchen, wie User über geschlechtsspezifische Medizin sprechen. Im Nachfolgenden zeige ich dir, warum das wichtig ist und wie wir es angestellt haben.
Das Thema: Geschlechtsspezifische Medizin
Unter geschlechtsspezifischer Medizin versteht man die Berücksichtigung von Unterschieden zwischen Männern und Frauen bei der medizinischen Forschung und Behandlung von Patient*innen. Diese Unterschiede spielen in beiden Bereichen immer noch eine untergeordnete Rolle und gefährden damit die Gesundheit von Patient*innen.
In der Vergangenheit wurden bei biomedizinischen Studien, klinischen Versuchen und der Entwicklung von Medikamenten männliche Probanden verwendet (Clayton 2016). In der Annahme, dass menschliche Zellen identisch sind, zogen Forschende aus ihren Ergebnissen Schlussfolgerungen für beide Geschlechter. Doch die Medizin ist keineswegs geschlechtsneutral (Regitz-Zagrosek 2012). Jüngstes Beispiel dafür ist die Covid-19-Pandemie: Studien zeigen, dass das Virus für Männer tödlicher ist als für Frauen, mit einer erhöhten Sterblichkeitsrate von 0.9 % bei chinesischen Männern und schwereren Fällen bei älteren europäischen Männern (Gebhard et al. 2020). Dieser Unterschied wird durch geschlechtsspezifische Faktoren wie die hormonell bedingte Immunantwort sowie Lebensstil, Stress und sozioökonomische Bedingungen verursacht (Gebhard et al. 2020).
Leider ist das Wissen zum Thema geschlechtsspezifische Medizin begrenzt. Ausserdem wird es bisher fast ausschliesslich von Expert*innen diskutiert. Die breite Öffentlichkeit bleibt von der Diskussion weitgehend ausgeschlossen. Die Frage lautet daher: Wie kann man das ändern?
Die Frage: Wie gestaltet sich der Informationsfluss zu geschlechtsspezifischer Medizin auf Twitter?
Heutzutage nutzen sowohl Privatpersonen als auch Gesundheitsdienstleister zunehmend soziale Medien, wie zum Beispiel Twitter, um gesundheitsbezogene Informationen auszutauschen. Aber wer interagiert hier mit wem? Wie gestaltet sich der Informationsfluss? Wie unterschiedlich ist das Wissen im Twitter-Netzwerk? Und wie könnte es möglicherweise verbessert werden? Um das herauszufinden, haben wir echte Daten aus Twitter-Diskussionen über geschlechtsspezifische Medizin analysiert.
Die Methode: Soziale Netzwerkanalyse
Um die Qualität der Diskussionen und den Informationsfluss rund ums Thema geschlechtsspezifische Medizin auf Twitter zu untersuchen, gingen wir wie folgt vor:
- Datenauswahl (4-stufige Auswahl mittels Suchbegriffe)
- Datenextraktion über die Twitter-API
- Klassifizierung der Netzwerkstruktur
- Erkennung von Communities
Zunächst wählten wir unsere Datenbasis aus, indem wir von Januar bis Mai 2021 öffentlich verfügbare Tweets mit 15 verschiedenen Suchbegriffen sammelten. Zum Aufbau des Netzwerks verwendeten wir das Python-Paket NetworkX (Hagberg et al. 2020). Wir haben alle 12’603 User einbezogen und Selbstschleifen aus den Daten entfernt. In unserem Netzwerk dienen die User als Knoten, und ihre Interaktionen in Form von Retweets, Zitaten, Antworten und Erwähnungen sind die Kanten. Für die Graphen haben wir das «Spring-Layout» verwendet, das auf dem Fruchterman-Reingold-Algorithmus basiert. Es bildet verbundene Knoten näher zueinander ab als unverbundene Knoten (Fruchterman und Reingold, 1991). Zu Beginn werden die Knoten auseinander geschoben, dann werden die verbundenen Punkte näher zusammengerückt. Dieses Layout hat den Vorteil, dass es grosse Netze aufnehmen kann und die Struktur der Community deutlich erkennen lässt.
In einem zweiten Schritt haben wir diese Daten über die Twitter-API extrahiert.
Dann folgte die Netzwerkklassifizierung. Um die Qualität der Diskussion über geschlechtsspezifische Medizin im Netzwerk zu beurteilen, schauten wir uns 4 Merkmale an (siehe auch Abbildung 1):
- Der Grad der Zentralisierung der Netzwerkstruktur: In stark zentralisierten Netzwerken steuern nur wenige User den Grossteil der Inhalte bei und dominieren daher den Informationsfluss (Barabási 2009; 2016). Um den Zentralisierungsgrad zu berechnen, massen wir die Summe der Zentralisierungsgrade aller Knoten dividiert durch die Anzahl der Knoten.
- Der Grad der Dichte: Wenn die Zentralisierung des Netzwerks unter 0.59 liegt, misst man in einem zweiten Schritt seine Dichte. In dichten Netzwerken unterhalten die User enge Beziehungen untereinander und bilden eine oder mehrere stark konzentrierte Communities (Himelboim et al. 2017).
- Die Verteilung der Verbindungen: Wenn die Dichte hoch ist, wird die Netzwerkmodularität gemessen. Diese gibt die Art der Verbindungen innerhalb des gesamten Netzwerks an.
- Der Anteil der Isolate: In einem letzten Schritt berechnet man den Anteil der Isolate, d. h. den Anteil der User ohne jegliche Interaktion mit anderen Usern. So unterscheidet man zwischen spärlichen Netzwerken mit wenigen verbundenen Communities (geclustert) oder Netzwerken mit einem hohen Anteil an Isolaten und wenigen Clustern (fragmentiert) (Himelboim et al. 2017).
Abbildung 1: Prozess der Netzwerkklassifizierung nach Smith et al. (2014)
Das Ergebnis: Geringe Zentralisierung, Dichte und Anteil der Isolate
Basierend auf den aus Twitter extrahierten Daten erstellten wir einen Graphen mit 12’603 Knoten und 16’704 Kanten (Antworten: 2’240; Erwähnungen: 5’243; Retweets: 9’221). Dieser erfasste die Netzwerkstruktur zum Gespräch rund um geschlechtsspezifische Medizin von Januar bis Mai 2021. Wir fanden heraus, dass innerhalb von fünf Monaten durchschnittlich 3.22 Interaktionen zum Thema geschlechtsspezifische Medizin zwischen Personen stattfinden.
KI-gestützte Datenanalyse
Die intelligente Nutzung von Daten kann für Unternehmen in verschiedensten Bereichen von Vorteil sein: Von Markt- und Kundenanalysen über Cybersicherheit bis hin zu finanziellem Risikomanagement. Insbesondere für die Analyse unstrukturierter Unternehmensdaten wie Text, Audio, Videos oder Bilder sind KI-gestützte Ansätze sehr hilfreich.
Im Hinblick auf die Merkmale des Netzwerks haben wir Folgendes festgestellt:
- Die Zentralisierung des Netzwerks ist sehr gering (0,0002103). Dies deutet darauf hin, dass die User des Netzwerks nicht auf zentrale Akteure angewiesen sind, um Informationen zu erhalten. Die Grenzen und die Vielzahl der Gruppen schaffen Wissenssilos und so eine Landschaft unterschiedlicher Meinungen und Perspektiven zum selben Thema.
- Die Graphendichte ist gering (0.0001052) und liegt sogar weit unter dem Schwellenwert von 0.12. Das Netzwerk ist also nicht nur dezentralisiert, sondern auch schwach vernetzt, was auf einen langsamen und angreifbaren Informationsfluss hindeutet. Ausserdem sind die User nur über wenige Wege erreichbar und stark von den Usern abhängig, die sie verbinden und ihnen Zugang zum Informationsnetz verschaffen. Diese Spärlichkeit verdeutlicht das Fehlen koordinierter Aktivitäten von offiziellen Quellen oder Pionierakteuren in diesem Bereich.
- Aufgrund der geringen Dichte des Netzwerks wurde Schritt 3 nicht durchgeführt. Stattdessen berechneten wir den Anteil der Isolate.
- Der Anteil der Isolate ist gering (3.99 %).
Daraus schliessen wir, dass das Netzwerk rund um geschlechtsspezifische Medizin eine Form von Gruppenkonnektivität aufweist, bei der sich einige mittelgrosse Communities um Knotenpunkte bilden (Himelboim et al. 2017). Es ist "geclustert", wie in Abbildung 2 zu sehen ist:
Abbildung 2: Ergebnis des Netzwerkklassifizierungsprozesses nach Smith et al. (2014)
Diese Netzwerkanalyse zeigte uns, dass die Diskussion über geschlechtsspezifische Medizin auf Twitter innerhalb und zwischen einigen wenigen verschiedenen Communities stattfindet. Die Communities sind stark miteinander verbunden und dichter als das Netzwerk insgesamt, was einen einfachen und schnellen Informationsaustausch zwischen ihren Mitgliedern ermöglicht. Um noch besser zu verstehen, wie geschlechtsspezifische Medizin auf Twitter diskutiert wird, beschlossen wir, diese Communities genauer unter die Lupe zu nehmen.
Ein Schritt weiter: Community-Erkennung
Um die verschiedenen Communities innerhalb des Netzwerks zur geschlechtsspezifischen Medizin genauer zu untersuchen, haben wir den ClausetNewman-Moore-Algorithmus mit NetworkX (NetworkX 2021) angewendet. Wir identifizierten 5 Haupt-Communities, die alle einen jeweils anderen Themenschwerpunkt diskutieren:
- In Community 1 (251 Knoten) berichten Personen kritisch über die Rolle des Geschlechts in verschiedenen Lebensbereichen.
- Community 2 (231 Knoten) ist geprägt von einigen wenigen Sendern und ihrem grösseren Publikum. Inhaltlich beschäftigt sich die Community mit den biologischen Aspekten der geschlechtsspezifischen Medizin. Dies lässt sich auf Hashtags wie #SABV oder #SexDifferences zurückführen.
- Community 3 (157 Knoten) dreht sich um die NGO Women's Brain Project, die sich für die Anerkennung geschlechtsspezifischer Unterschiede zwischen Männern und Frauen in der psychischen Gesundheit und der Neuromedizin einsetzt.
- Community 4 (129 Knotenpunkte) konzentriert sich auf Herz-Kreislauf-Erkrankungen bei Frauen, wobei die 5 wichtigsten User Kardiolog*innen sind.
- Community 5 (129 Knoten) umfasst hauptsächlich kanadische User, die sich auf die #WearRedCanada-Kampagne konzentrieren.
Da sich der Austausch dieser einzelnen Communities um sehr spezifische Unterthemen der geschlechtsspezifischen Medizin dreht, können wir sagen, dass sich das Netzwerk insgesamt durch sogenannte «Homophilie» auszeichnet – User neigen dazu, sich mit Gleichgesinnten zu umgeben. Dies bedeutet auch, dass das Wissen in Silos strukturiert ist und sich die Informationen innerhalb der Communities kaum unterscheiden.
Mehr Artikel über intelligent genutzte Daten
Wie du dank Daten mehr über deine Kund*innen erfährst? Lies es hier!
Wie du Daten nutzt, um die Produktnachfrage vorherzusagen? Mehr darüber erfahren!
Wie ein Data Engineer Unternehmen bei der Datenbeschaffung hilft? Jetzt anhören!
Fazit
Bei der Analyse der Art und Weise, wie geschlechtsspezifische Medizin auf Twitter diskutiert wird, fanden wir heraus, dass der Informationsaustausch begrenzt ist. Dies ist auf die eingeschränkte Informationszirkulation, die Dezentralisierung und die geringe Grösse des Netzwerks zurückzuführen. Das Netzwerk zur geschlechtsspezifischen Medizin besteht aus einzelnen Communities, die Wissenssilos und so eine Landschaft unterschiedlicher Meinungen und Perspektiven bilden. Dies sind nicht gerade ideale Bedingungen für eine ganzheitliche öffentliche Diskussion über die Bedeutung der geschlechtsspezifischen Medizin.
Kehren wir daher zu unserer Ausgangsfrage zurück: Wie könnte diese Situation verbessert werden? In der Tat gibt es mehrere Massnahmen, die z. B. Public Health Manager und Marketingagenturen von Gesundheitsinstituten ergreifen können, um Twitter zu einem Ort wirklich nutzbringender Diskussion über geschlechtsspezifische Medizin zu machen:
- Communities für gruppenspezifische Informationen nutzen: Die Tatsache, dass es einzelne Communities gibt, kann genutzt werden, um Usern gruppenspezifische und massgeschneiderte Informationen zur Verfügung zu stellen. So befasst sich beispielsweise Community 3 mit den Neurowissenschaften und den Auswirkungen von Sex- und Gender-Variablen auf das Gehirn. Hier könnten Public Health Manager Informationen zum Thema Kardiologie platzieren, um die Informationsvielfalt für die Mitglieder dieser Community zu erweitern.
- Nutzung von Multiplikatoren zur Verbreitung von Informationen: Mithilfe der Daten könnte man auch einflussreiche User identifizieren. Diese können dann als Multiplikatoren von Informationen fungieren, da sie in der Lage sind, diese viel schneller und effizienter zu verbreiten als andere User im Netzwerk.
- Inhalte mit Hashtags vereinigen: Um eine koordinierte Interaktion zu unterstützen, könnten Online-Marketing-Agenturen von nationalen Gesundheitsinstituten eine Top-Down-Verbreitung eines einzigen Hashtags starten, der Inhalte zur geschlechtsspezifischen Medizin auf Twitter bündelt.
Wie du siehst, kann die Analyse von Social-Media-Daten zu unerwarteten Erkenntnissen führen – sei es über das Gesprächsverhalten der Menschen zu einem bestimmten Thema, wie in unserem Beispiel, oder über die Zielgruppe oder Kunden eines Unternehmens. Daraus kann man dann spezifische Massnahmen und Handlungsempfehlungen ableiten.
Referenzen
Barabási, A.-L.2009. “Scale-Free Networks: A Decade and Beyond,” Science, (325:5939), pp.412–413.
Barabási, A.-L. 2016. Network Science, Cambridge University Press.
Clayton, J. A. 2016. “Studying Both Sexes: A Guiding Principle for Biomedicine,” FASEB Journal (30:2), pp. 519–524.
Fruchterman, T. M. J., and Reingold, E. M. (1991) Graph Drawing by Force-Directed Placement, Software: Practice and Experience, 21, 11, 1129–1164.
Gebhard, C., Regitz-Zagrosek, V., Neuhauser, H. K., Morgan, R., and Klein, S. L. 2020. “Impact of Sex and Gender on COVID-19 Outcomes in Europe,” Biology of Sex Differences (11:29), p 1-13.
Hagberg, A., Schult, D., and Swart, P. 2020. NetworkX. (https://networkx.org/documentation/networkx1.10/download.html, /, accessed February 18, 2022).
Himelboim, I., Smith, M. A., Rainie, L., Shneiderman, B., and Espina, C. 2017. “Classifying Twitter TopicNetworks Using Social Network Analysis,” Social Media + Society (3:1), p. 1-13.
NetworkX. 2021. “Networkx.Algorithms.Community.Modularity_max.Greedy_modularity_communities — NetworkX 2.6.2 Documentation,” NetworkX 2.6.2 Documentation.
Regitz-Zagrosek, V. 2012. “Sex and Gender Differences in Health,” EMBO Reports (13:7), pp. 596–603.

MEHR VON UNSEREN TECH-EXPERT*INNEN:

