Die Augen der Soziologie. Was mathematische Modelle sichtbar machen

Christian Steglich im Gespräch mit Janosch Schobin über Netzwerkanalytische Simulationsmodelle der letzten Generation

Es kommt nicht oft vor, dass die Soziologie benachbarten Sozialwissenschaften auf dem Gebiet der statistischen Methoden einen Schritt voraus ist. Die quantitative Netzwerkanalyse stellt die große Ausnahme von dieser Regel dar. Im Rahmen einer zugleich durch Georg Simmels formale Soziologie und durch Max Webers methodologischen Individualismus inspirierten, mathematischen Soziologie sind komplexe statistische Simulationsmodelle entwickelt worden, die es gestatten, die Veränderungen sozialer Netzwerke über die Zeit systematisch zu beschreiben und teils auch zu erklären. Selbst die statistisch hochgezüchtete empirische Wirtschaftsforschung hat nichts Vergleichbares im Angebot. Die Simulationsanalyse von Netzwerkzeitreihen ist jedoch mehr als ein weiterer Pfeil im sich stetig ausdifferenzierenden Methodenköcher der Sozialwissenschaften. Es handelt sich um eine statistische Methode, die unabdingbar ist, um eine Gesellschaft, die sich immer stärker netzwerkförmig selbstorganisiert, überhaupt beobachten zu können. Insofern stellt die quantitative Netzwerkanalyse nicht bloß eine Methode dar, vielmehr liefert sie einer kommenden Soziologie ein für ihr Überleben geradezu unverzichtbares Sinnesorgan. Im Zentrum jüngster Weiterentwicklungen steht eine Gruppe von Forschern um Tom Snijders an der Rijksuniversiteit Groningen. Zu ihnen gehört Christian Steglich.

Janosch Schobin: Sie sind maßgeblich an der Entwicklung von SIENA beteiligt gewesen, einer Software, die es erstmals einer größeren Anzahl an Forschern ermöglicht hat, Längsschnittsdaten vollständiger sozialer Netzwerke zu analysieren. Bei welcher Art von Forschungsfragen ist Anwendung von SIENA hilfreich?

Christian Steglich: Das klassische Anwendungsgebiet ist das Messen der Stärke von endogenen Mechanismen der Netzwerkevolution, wie zum Beispiel die Gegenseitigkeit von Beziehungen, die transitive Gruppenbildung,1 oder auch die Entstehung und Fortentwicklung hierarchischer Strukturen in sozialen Netzwerken.

Traditionell sind viele Anwender aber gar nicht primär an diesen netzwerkendogenen Prozessen interessiert. Sie erfahren vielmehr die Abhängigkeiten in den Daten, die sich aus solchen Prozessen ergeben, als lästige Komplikation der Datenanalyse, die einfachere Analyseverfahren wie Regressionen oder Mehrebenenanalysen ausschließen. Die Forschungsfragen betreffen dann einerseits Effekte exogener Variablen auf die Netzwerke, wie zum Beispiel den Effekt geografischen Abstands oder ethnischer Grenzen auf Freundschaftsbeziehungen. Andererseits liegt der Fokus oft auf sich im Kontext eines dynamischen Netzwerks veränderndem Individualverhalten, wie zum Beispiel der Beeinflussung gesundheitlichen Risikoverhaltens durch das Verhalten der Freunde.

Was ist heute mit SIENA möglich und an welchen weiteren Einsatzmöglichkeiten arbeiten Sie zur Zeit?

Das Basismodell für Netzwerkevolution2 wurde schon 1996 von Tom Snijders vorgestellt. Seither ist die Breite der Einsatzmöglichkeiten ausgedehnt worden. Zu nennen sind hier besonders die Analyse der Evolution von sozialen Netzwerken mit mehreren Beziehungsebenen, der Koevolution von Netzwerken und individuellem Verhalten und die Möglichkeit der Analyse sogenannter bipartiter Affiliationsnetzwerke. Darunter werden Netzwerkdaten verstanden, die aus der Bindung sozialer Akteure an Organisationen oder ihrer Teilnahme an Veranstaltungen gewonnen werden. Ein Beispiel hierfür wäre etwa ein Netz, das entsteht, wenn man abbildet, welche Politiker_innen in den Aufsichtsräten welcher Unternehmen sitzen.

Zurzeit arbeiten wir in unserem Team an einer Verallgemeinerung der Beeinflussungsmodelle, die mit nicht-diskreten, also auf einem Kontinuum gemessenen Verhaltensvariablen umgehen können. Ich selbst entwickle gerade Modelle, die es erlauben werden, die Zusammenstellung des Netzwerks als endogenen Prozess zu modellieren. Ein häufiges Problem bei Netzwerkstudien ist bekanntlich, dass Akteure das Netzwerk beziehungsweise den Beobachtungskontext des Netzwerks (etwa die Schulklasse) verlassen. Oft geschieht das nicht rein zufällig, sondern ist seinerseits ein Effekt der Netzwerkevolution. Man denke etwa an das Phänomen des Bullying. Deswegen will ich das Eintreten oder Ausscheiden von Netzwerkakteuren aufgrund interner Netzwerkprozesse modellierbar machen.

Darüber hinaus wird im Team an effizienteren Schätzverfahren und an einer Skalierung der Methode auf große Netzwerke mit mehreren zehntausend Akteuren gearbeitet. Bisher wurden in SIENA-Analysen vor allem die Netzwerkdaten von Schulklassen und ähnlich überschaubaren sozialen Kontexten verwendet, die maximal einige Hundert Akteure umfassten. Nicht zuletzt durch die massive Verbreitung von Social Networking Sites verfügen Wissenschaftler heute jedoch immer öfter über Längsschnittdaten stark entgrenzter sozialer Netzwerke. Hier besteht ein großes Anwendungspotenzial für die Netzwerkanalyse allgemein, und unsere Modelle werden dafür gerade fit gemacht.

Sie sprechen mit der Skalierbarkeit einen interessanten Punkt an. Eine der gängigen Kritiken an SIENA und anderen statistischen Netzwerkmodellen lautet ja, dass die üblicherweise analysierten, kleinen Netzwerke im Grunde als eine überschaubare Reihe komplexer Einzelfallbeobachtungen verstanden werden könnten. Oft sind es ja nur wenige Schulklassen oder einige Klassenjahrgänge, deren Daten betrachtet werden. Die Überlegung ist dann schnell: Da es sich um Einzelfallstudien handelt, wäre es nicht ebenso gut möglich, die Fragestellungen mit einer Mischung aus deskriptiven Netzwerkanalysen, klassischen statistischen Verfahren (etwa Mehrebenenanalysen) und üblichen qualitativen Methoden (etwa teilnehmenden Beobachtungen, Interviews, Gruppendiskussionen usw.) zu bearbeiten?

Als mathematischer Soziologe und Statistikdozent ist mir eine solche Herangehensweise suspekt, kaschiert sie doch oft nur den Unwillen, sich ernsthaft mit neuen statistischen Verfahren auseinanderzusetzen. Klassische statistische Verfahren sind bei den meisten Netzwerkdatensätzen, ob groß oder klein, eindeutig fehl am Platz. Das liegt daran, dass sie von Unabhängigkeitsannahmen ausgehen, die von den Daten ganz eindeutig nicht erfüllt werden. Immerhin sind es meistens ja gerade die Abhängigkeiten zwischen sozialen Akteuren und zwischen ihren mannigfaltigen Beziehungen, die der Forschungsgegenstand der Netzwerkanalyse sind. Bei einer Analyse mit klassischen Verfahren weiß man am Ende nie, ob ein statistisch signifikantes Testresultat überhaupt Rückschlüsse auf die zu testende Hypothese zulässt, oder einfach nur eine signifikante Verletzung der Grundannahmen des Verfahrens belegt.

Wofür ich aber durchaus plädiere, ist eine mixed methods Herangehensweise. Eine statistische Netzwerkanalyse mit SIENA liefert letztlich, in der verklausulierten Form statistischer Tests, eine Story des Geschehenen im studierten Netzwerk. Es liegt auf der Hand, solche Interpretationen mithilfe der parallelen Erhebung qualitativer Daten zu validieren. Das passiert bislang viel zu selten, oft gibt man sich nur mit der Statistik oder nur mit der qualitativen Analyse zufrieden, ohne mögliche Synergien zu nutzen.

Zurück zum Thema Skalierbarkeit. Bei sehr großen Netzwerken stoßen qualitative oder klassische beschreibende Verfahren auf grundsätzliche Schwierigkeiten, obwohl die Voraussetzungen sich eigentlich nicht verändert haben: Es handelt sich faktisch auch wieder nur um Einzelfallbeobachtungen. Sie mit den herkömmlichen methodischen Mitteln zu bearbeiten, wirkt jedoch auf Grund der enormen Komplexität der Daten aussichtslos, die nun nicht nur einige Hundert oder Tausend, sondern Millionen Beziehungen zwischen Akteuren abbilden. Also stellt sich die Frage, welchen methodischen Zweck komplexe statistische Methoden wie SIENA eigentlich erfüllen, wenn es um die Beobachtung sozialer Netzwerke geht? 

In SIENA-Analysen werden – wie Sie ganz richtig sagen – oft nur einzelne Netzwerke mit einigen Dutzend Akteuren zu zwei, drei Zeitpunkten modelliert. In den Sozialwissenschaften wurden statistische Verfahren dagegen lange vornehmlich eingesetzt, um aus einer stark begrenzten Anzahl zufallsausgewählter Beobachtungen Rückschlüsse über eine wesentliche größere Grundgesamtheit zu ziehen. Es ging um die Beobachtung von Bevölkerungen mit begrenzten Mitteln. Statistik ist dann primär dazu da, die Fehlergrößen einzuschätzen, die der Stichprobenziehung geschuldet sind. Das ist bei SIENA-Modellen deshalb anders, weil das grundlegende Problem ein anderes ist. Die Veränderung von Netzwerken in der Zeit ist ein extrem hochdimensionales Phänomen. Und das gilt im Übrigen schon für kleine Netzwerke. Denken Sie beispielsweise nur daran, wie viele verschiedene Freundschaftsnetzwerke in einer Schulklasse mit 20 Schülern möglich sind. Die Anzahl ist überraschend groß, nämlich größer als 10 hoch 114. (Gemeint sind hier labelled, directed, loopless graphs, berechnet als 4^((n¦2)) ). Die Zahl möglicher Netzwerke ist gigantisch. Und in der Regel verfügen wir nur über einige wenige Beobachtungszeitpunkte solcher Netzwerke. Sie zu erfassen, ist sehr aufwendig. Und nun hat sich eines dieser über 10 hoch 114 möglichen Netzwerken in ein anderes verwandelt. Was ist passiert? Welche Typen von Netzwerken wurden dabei systematisch nicht angesteuert? Welche ähnlichen Netzwerke waren ebenso gut möglich? Als Wissenschaftler unterstellen wir dabei, dass sowohl systematische Gründe, etwa die Präferenzen von Akteuren für ähnliche Akteure oder für Freunde von Freunden, als auch Zufallseinflüsse, eine Rolle spielen. Aber was sind die systematischen Mechanismen, die ein Netzwerk in eine bestimmte Entwicklungsrichtung drängen und wie groß ist der Zufallsanteil? Um auf solche Fragen halbwegs stichhaltige Antworten geben zu können, braucht man einen theoretischen Rahmen, der sich in ein möglichst explizites, generatives, mathematisches Modell verwandeln lässt. Rein beschreibende Methoden, qualitative wie quantitative, reichen da nicht hin. Die Beobachtung ist einfach zu komplex, und das ist, wie gesagt, schon bei einer einfachen Schulklasse so. Die Signifikanzen unsere Modelle zeigen dabei nicht Fehlergrößen der Verteilung eines Merkmals an, das aus eines Stichprobe geschätzt wurde, sondern sie zeigen Abweichungen von der zu erwartenden „mittleren“ Veränderung eines sich zufällig verändernden Netzwerks an. Das Modellieren läuft darauf zu, stochastische Modelle zu finden, deren Simulation Daten erzeugt, die den beobachteten Daten in theoretisch bedeutsamen Hinsichten hinreichend ähnlich sind. Wir bewegen uns also teils auf dem Gebiet der Statistik, da wir gegebene empirische Daten analysieren, teils aber auf dem Gebiet sozialer Simulation, da wir mit generativen Modellen diese Daten aufgrund theoretisch plausibler sozialer Mechanismen nachbilden und so zu verstehen versuchen.

Etwas plakativ formuliert: Ihre Modelle sind also Wahrnehmungsprothesen, dank derer die Gesetzmäßigkeiten dynamischer Veränderungen von Netzwerken überhaupt erst beobachtbar werden?

Ja, so könnte man es ausdrücken. Tatsächlich kommen Verfahren dieses Typs heute in immer mehr Wissenschaftsfeldern zur Anwendung. Spätestens seit Anfang der 1980er-Jahre wird in den Sozialwissenschaften neben der klassischen, auf Zufallsstichproben beruhenden Statistik auch diese Statistik der generativen Modelle angewandt. Das hat natürlich viel mit technischem Fortschritt in der Computertechnik zu tun, aber auch mit Veränderungen in der Gesellschaft und den daraus sich ergebenden neuen Forschungsfragen in den Sozialwissenschaften. Viele komplexe, zeitveränderliche Sachverhalte lassen sich erst durch die Brille statistischer Modelle gut beobachten. Wir versuchen, um es etwas schematisch zu formulieren, ja mehr zu leisten, als einfach nur relative Eigenschaften einer Bevölkerung zu beobachten, die sich aus voneinander unabhängigen Individuen zusammensetzt. Zwar spielen Fragen, die sich auf die Veränderung deskriptiver Elemente einer Population beziehen, wie: „Wie viele Arbeiterkinder eines Jahrgangs machten 1960 ihr Abitur, wie viele 1970 und wie erklärt sich die Veränderung?“, noch immer eine Rolle. Doch sind wir heute viel stärker an den kollektiven Mechanismen interessiert, die zu derartigen Veränderungen führen. Diese äußern sich aber stets in einer Vielzahl verketteter, kleiner sozialer Ereignisse, jenseits der großen politischen Entscheidungen, die selbstverständlich auch zu solchen Veränderungen beitragen (können). So kann ein Schüler aus der Arbeiterschicht durch eine zufällige Zeitungslektüre für ihn interessante Dinge über die Chancen in der Zahnmedizin erfahren. Unter Umständen verändern diese Informationen die Überzeugungen des Arbeiterkindes, was die Perspektiven medizinischer Berufe angeht. Vielleicht berichtet es einem Onkel von seinem neuen Traumberuf, der dann wiederum die Eltern davon überzeugt, das Studium der Zahnmedizin zu unterstützen. Der Fall kann aber auch ganz anders liegen. Die Eltern sehen, dass ein Mädchen aus der Nachbarschaft, das sein Abitur erfolgreich bestanden hat, eine gute Partie macht, und beschließen daraufhin, auch ihre Tochter aufs Gymnasium zu schicken. Dort hat sie Umgang mit Freundinnen aus Akademikerfamilien, die sie davon überzeugen, nur nicht so schnell zu heiraten, sondern gegen den Widerstand der Eltern ein Studium aufzunehmen. Es gibt viele Weisen, auf die sich Eigenschaften, soziale Beziehungen und individuelle Verhaltensentscheidungen kausal so miteinander verstricken, dass im Resultat der Akademikeranteil unter Arbeiterkindern steigt. Aus meiner Sicht sind es heute Netzwerkdynamiken, die in der ersten Reihe stehen, wenn es um die Erklärung der kollektiven Veränderung individuell zuschreibbarer Verhaltensweisen und Vorstellungen geht. Nur ist die „Population“ solcher interdependenten Netzwerk- und Verhaltensentscheidungen nicht gut in unabhängige Einheiten aufteilbar, aus denen man eine Stichprobe ziehen könnte. Alles hängt ja irgendwie zusammen. Zudem sind viele der wirksamen Kausalitäten in- oder miteinander verschaltet. Das Beste, was man angesichts dieser Sachverhalte machen kann, ist sie in ihrem Zusammenhang einzelfallartig möglichst detailliert und großflächig zu beobachten, um sie dann mit den Simulationen aus theoretisch expliziten, stochastischen Modellen zu vergleichen.

Offenbar ist es schwierig, wenn nicht völlig unmöglich, soziale Wandlungsprozesse, in denen Netzwerke eine Rolle spielen, ohne die Hilfe statistischer Wahrnehmungsprothesen angemessen zu beobachten. Damit stellt sich aber doch die Rückfrage: „Welche Alternativen schließen Ihre Modelle eigentlich aus?“ „Welche anderen Modelle stehen zur Verfügung und was können sie sichtbar machen, das dank Ihrer Modelle nicht beobachtet werden kann?“

Wir wissen als Modellentwickler sehr gut, dass unsere derzeitigen Modelle keineswegs alternativlos sind. Außerdem sind uns die theoretischen Annahmen – die großen, wie die kleinen – bewusst, mit denen wir operieren. So gehen wir etwa davon aus, dass soziale Akteure ihre ausgehenden Beziehungsanfragen oder Beziehungsangebote kontrollieren und dass sie ihr eigenes Individualverhalten steuern. Wir sind, anders gesagt, methodische Individualisten, die mit akteurszentrierten Modellen arbeiten. Andere vergleichsweise starke Annahmen hängen mit unserem methodologischen Individualismus zusammen, resultieren allerdings nicht aus ihm. Beispielsweise sind unsere Simulationsmodelle so aufgebaut, dass zu jedem Zeitpunkt nur ein einziger Akteur ein einziges Detail, das in seiner Macht steht, verändern kann, also etwa nur eine einzelne ausgehende Beziehung zurücknehmen, anbieten oder unverändert lassen kann. Die Gleichzeitigkeit von Entscheidungen ist folglich in unseren Modellen nicht vorgesehen. Außerdem sind diese Modelle ‚gedächtnislos‘: Sie unterstellen, dass zu jedem Zeitpunkt der gegenwärtige Zustand eines Netzwerks alle für dessen Zukunft relevanten Informationen aus dessen Vergangenheit enthält (Markov-Annahme bei stochastischen Prozessen). Das sind sehr starke Einschränkungen, die durchaus auch empirisch zu Unstimmigkeiten zwischen unseren Modellen und den beobachteten Netzwerkveränderungen führen. So tun sich unsere Modelle zum Beispiel oft schwer, die Menge an gegenseitigen Freundschaftsbeziehungen zu replizieren, die zwischen zwei Beobachtungszeitpunkten neu entstehen. Das liegt daran, dass solche reziproken Freundschaften oft „uno-actu“ geschlossen werden und nicht zuerst einer anfragt und der andere sich dann überlegt, ob er die Freundschaft erwidert. Ferner unterstellen wir bisher, dass die sozialen Akteure stets jede mögliche Alternative im Netzwerk auswerten. Das wird spätestens bei sehr großen Netzwerken eine zweifelhafte Unterstellung. Man könnte die Liste kleiner Ungereimtheiten so fortführen. Viele der Einschränkungen sind dabei – wie gesagt – der theoretischen Grundentscheidung geschuldet, die Akteure für selbstbestimmt zu halten. Andere sind einfach zweckmäßig und haben eher praktische Gründe: Die Simulationen würden erheblich mehr Daten erfordern, wenn wir die Gleichzeitigkeit von Entscheidungen zulassen würden, die Modellparameterschätzer aber mit gleicher Präzision schätzen wollten. Bei großen Datensätzen kann man einige Modellannahmen fallen lassen oder durch andere, in diesem Kontext plausiblere, ersetzen – das ist, wie bereits erwähnt, eine der im Moment bearbeiteten Modellerweiterungen.

Was Alternativen zu unseren Modellen angeht, ist die Lage im Moment so, dass es nicht allzu viele gibt. Im Wesentlichen handelt es sich um Varianten der für Querschnittnetzwerkdaten entwickelten exponentiellen Zufallsgraphenmodelle, die ähnliche und mitunter sogar noch wesentlich voraussetzungsreichere Unterstellungen machen. In ihren Konsequenzen sind diese Modelle oft schwerer zu durchschauen als SIENA-Modelle, weil ihnen der explizite Bezug zu Entscheidungsregeln sozialer Akteure fehlt.

Noch eine letzte, etwas spekulative Frage: Durch Ihre Methoden werden Netzwerke besser beobachtbar, und dadurch wird es sozialen Akteuren tendenziell möglich, ihr Verhalten reflexiv an sozialen Netzwerken zu orientieren. Nehmen Sie Unternehmen als Beispiel, die heute unsere Freundschaftsnetzwerke beobachten, um uns Werbung anzuzeigen. Mündet das letzten Endes nicht alles in eine neue Form der technokratischen Steuerung der Bevölkerung ein?

Unsere Modelle sind nicht besonders gut für Prognosen auf dem Niveau von Individuen oder gar auf dem Dyadeniveau (also auf dem Niveau der Beziehungen zwischen zwei Individuen) geeignet. Sie prognostizieren konkrete zukünftige Netzwerke eher schlecht, ihre Vorhersagequalität liegt auf dem Systemniveau: Das typische Verhalten typischer sozialer Akteure innerhalb typischer sozialer Einbettungen wird recht gut vorhergesagt. Der Zweck der Modelle ist daher viel eher rekonstruktiv. Wir wollen verstehen, aus welchen systematischen Gründen es so gekommen ist, wie es gekommen ist. Einer globalen „Silicon-Valley-Kybernetik“ arbeiten unsere Modelle also nicht zu. Um Netzwerksysteme steuern zu können, müsste man sie nämlich erstmal konkret auf Individual- und Dyadenniveau vorhersagen können.

Ich sehe allerdings durchaus demokratische Potenziale der Verbreitung unserer Modelle. Nehmen Sie parlamentarische Entscheidungen, die heute immer öfter durch Lobbyisten beeinflusst werden. Das ist ein undurchschaubares, dynamisches Netzwerk aus sozialen Beziehungen und dem Abstimmungsverhalten einzelner Parlamentarier. Abgesehen von eklatanten Einzelfällen ist es schwer, den systematischen Zusammenhang der Beziehungen zwischen Lobbyisten und Parlamentariern sowie den Entscheidungen von Parlamentariern zu rekonstruieren. Ähnliche Analysen über Netzwerke unter Journalisten und Lobbyisten, Journalisten und Politiker oder über alle zusammen wären sicherlich auch aufschlussreich. Mit den dynamischen Netzwerkmodellen für große Netzwerke, wie wir sie gerade entwickeln, ist es tendenziell möglich, nicht nur die systematischen Beeinflussungseffekte in solchen Netzwerken zu rekonstruieren, sondern auch ihre zentralen Akteure und treibenden Eigendynamiken zu identifizieren. Deshalb glaube ich, dass eine demokratische Öffentlichkeit dank unserer Modelle das Wirrwarr des globalen ökonomisch-politischen-Netzwerks besser durchblicken könnte. Insofern statten wir diese Öffentlichkeit mit wertvollen Kenntnissen aus. Sie leisten ihren Beitrag dazu, dass demokratische Gemeinwesen nicht mehr und mehr zum Spielball politisch agierender Wirtschaftsakteure werden, die in globalem Maßstab handeln.

Fußnoten

1 Unter einer transitiven Gruppe wird verstanden, dass für drei unterschiedliche Akteure A, B und C stets gilt, dass aus einer von A ausgehenden Beziehung zu B und einer von B ausgehenden Beziehung zu C folgt, dass auch eine von A ausgehende Beziehung zu C existiert.

2 Der Begriff ‚Netzwerkevolution‘ bezieht sich hier vor allem auf die Entwicklung von Netzwerken über die Zeit. Es handelt sich nicht um eine biologische Metapher.

Dieser Beitrag wurde redaktionell betreut von Martin Bauer.