Paneldaten

Potenziale und Herausforderungen für die sozialwissenschaftliche Forschung

Der vorliegende Beitrag diskutiert Potenziale und Grenzen von Paneldaten, einer speziellen Art von Längsschnittdaten, die durch wiederholte Untersuchung derselben Personen mit – zumindest in Teilen – identischen Erhebungsinstrumenten (zum Beispiel Fragebögen) gewonnen werden.1 Paneldesigns haben in der sozialwissenschaftlichen Forschung eine lange Tradition: Die ersten dokumentierten Panelstudien wurden bereits in den 1940er-Jahren an der Columbia University im Bereich Wahlforschung von der Arbeitsgruppe um Paul F. Lazarsfeld durchgeführt.2 Aktuell sind Panelstudien vor allem in den Sozial- und Lebenswissenschaften verbreitet.3 Im Folgenden liegt der Fokus auf dem am häufigsten vorkommenden Datentyp, den Befragungsdaten.4 Unsere Überlegungen lassen sich jedoch prinzipiell auch auf Daten aus Verhaltensbeobachtungen oder aus anderweitigen Erhebungsmethoden übertragen.

Längsschnittdesigns: Trendstudien und Panelstudien

Längsschnittdesigns, bei denen die Daten zu mindestens zwei Zeitpunkten erhoben werden, gelten als Königsweg der quantitativen sozialwissenschaftlichen Forschung, sowohl was die Beschreibung als auch was die Erklärung sozialer Phänomene betrifft. Naturgemäß liegt die Bedeutsamkeit von Längsschnittdaten – im Unterschied zu Querschnittdaten, die nur zu einem Zeitpunkt erhoben werden – in der Möglichkeit, Aussagen über zeitliche Trends und Veränderungen von Merkmalen zu treffen, weshalb sie unter anderem ausgiebig in der Sozialberichterstattung genutzt werden. Bei den Längsschnittdesigns muss zwischen Trend- und Panelstudien unterschieden werden: In Trendstudien werden wiederholt und unabhängig voneinander unterschiedliche Stichproben gezogen, welche die Grundgesamtheit, über die es Aussagen zu treffen gilt, möglichst gut repräsentieren sollen. Trenddesigns kommen unter anderem häufig in der Wahlforschung zum Einsatz, beispielsweise in Form der „Sonntagsfrage“ zur Erfassung der Wahlabsicht oder bei Popularitätseinschätzungen von Spitzenpolitikern. Sofern die Stichprobe als „repräsentativ“, das heißt quasi als ein verkleinertes Abbild der Grundgesamtheit angesehen werden kann, erlauben Auszählungen von Trenddaten die Beschreibung des momentanen „Stimmungsbildes“ der Wählerschaft und ermöglichen somit Repräsentationsschlüsse aggregierter Informationen (etwa von Stimmanteilswerten oder Mittelwerten auf einer Popularitätsskala) auf die Grundgesamtheit (hier: die gesamte Wählerschaft) sowie Vergleiche derartiger Kennzahlen über die Zeit (zum Beispiel in Form von Trenddarstellungen). Im Prinzip basieren Trendstudien auf einem wiederholten Querschnittdesign und erfordern daher typischerweise einen beträchtlichen Erhebungsaufwand, um überhaupt Längsschnittinformationen zu produzieren. Im Interesse der Vergleichbarkeit müssen die Untersuchungsthemen beziehungsweise die Erhebungsinstrumente zumindest in Teilen über die Erhebungen hinweg identisch sein.

Panelstudien zielen demgegenüber auf die wiederholte Untersuchung derselben Personen mit partiell identischen Erhebungsinstrumenten ab. Durch die mehrfache Befragung derselben Personen sind Paneldaten informationshaltiger als Trenddaten: Sie erlauben nicht nur Repräsentationsschlüsse auf die Grundgesamtheit – wenn auch erst nach Überwindung spezifischer Probleme (siehe unten) – und diachrone Vergleiche aggregierter Statistiken wie Anteils- oder Mittelwerte, sondern sie ermöglichen zudem Aussagen über (aggregierte) Veränderungen innerhalb derselben Personen. So ist es etwa auf Basis von Paneldaten möglich, Anteile von Wechselwähler_innen zu bestimmen und dabei auch die Häufigkeit spezifischer Wechselbewegungen zwischen den jeweiligen Parteien zu quantifizieren. Hierbei handelt es sich um ein idealtypisches, didaktisches Beispiel. In der Praxis wird häufig (nicht zuletzt aus Kostengründen) auf das Paneldesign zu Gunsten einer Retrospektivfrage zu vorangegangenen Wahlentscheidungen verzichtet.5 Die vielleicht größten Vorteile bieten Paneldaten bei der Untersuchung von Kausalzusammenhängen (zum Beispiel dem Einfluss des Einkommens auf die Parteiidentifikation), da ein Ursache-Wirkungs-Zusammenhang nur innerhalb derselben Personen sinnvoll postulierbar ist.6

Identifikation kausaler Ursache-Wirkungs-Zusammenhänge

In den Möglichkeiten zur Identifikation kausaler Ursache-Wirkungs-Relationen zwischen zwei Merkmalen liegt demnach die größte Stärke von Paneldaten. An welche Bedingungen ist nun aber der Nachweis von Kausalität geknüpft? In der Literatur7 werden drei Punkte genannt: 1. Eine eindeutige zeitliche Ordnung, das heißt die Ursache muss der Wirkung vorausgehen; 2. eine erhöhte Wahrscheinlichkeit des gemeinsamen Auftretens beider Merkmale; und 3. ein Fortbestehen des Zusammenhangs bei statistischer Kontrolle relevanter Drittvariablen. Während die ersten beiden Bedingungen intuitiv verständlich sind, bedarf das dritte Kriterium einer kurzen Erläuterung. Ein Beispiel von Lazarsfeld8 mag veranschaulichen, worum es geht: Selbst wenn zwischen den beiden Merkmalen „Häufigkeit des Vorkommens von Störchen“ und „Geburtenhäufigkeit“ ein stochastischer Zusammenhang bestehen sollte, wäre das noch kein Beleg für Kausalität.9 Vielmehr dürften beide Beobachtungen eine gemeinsame Ursache haben, nämlich das Merkmal „ländlicher Raum“. Letzterer determiniert sowohl die Zahl der Störche als auch der Geburten (zum Beispiel wegen stärkerer Verbreitung familiärer Milieus auf dem Lande). Hielte man den Urbanitätsgrad statistisch konstant, indem man die Beobachtung nur auf den ländlichen oder nur auf den urbanen Raum beschränkte, ließe sich der positive Zusammenhang zwischen Storchen- und Geburtenhäufigkeit vermutlich nicht replizieren – es handelt sich also um einen scheinkausalen Zusammenhang.10

An dieser Stelle könnte ein Einwand lauten, dass eine rückblickende (retrospektive) Erfassung der zeitlich vorgelagerten potenziellen Ursachenfaktoren auch im Querschnittdesign die Untersuchung kausaler Effekte ermöglichte. Das mag zwar prinzipiell zutreffen, allerdings stieße ein solches Vorgehen schnell an praktische Grenzen. So ließen sich objektiv messbare Daten (zum Beispiel das frühere Einkommen) unter bestimmten Umständen noch einigermaßen zuverlässig rekonstruieren, etwa anhand früherer Gehaltsbescheinigungen. Spätestens aber bei stärker subjektiv gefärbten Daten (beispielsweise Einstellungen und Wertorientierungen) stieße das Verfahren an seine Grenzen, da valide retrospektive Messungen über längere Zeiträume hier kaum möglich sind: Denn je länger erinnerte Zustände und Ereignisse zurückliegen, desto eher treten bekanntlich Verzerrungs und Rationalisierungstendenzen auf,11 das heißt Befragte integrieren diese sinnhaft in die eigene Biographie. Ohne zumindest kurzfristige Erinnerungsleistungen kommen aber auch Panelstudien freilich nicht aus. Regelmäßig erforderlich sind etwa Fragen nach Merkmalsveränderungen seit der letzten Befragung (beispielsweise „Hat sich seit der letzten Befragung Ihr Familienstand verändert?“). Allerdings werden Erinnerungsverzerrungen bei mehrfacher Befragung durch das kürzere Erinnerungsintervall minimiert. Zudem ermöglicht die in computergestützten Befragungen eingesetzte Methode des sogenannten „Dependent Interviewing“12 ein gezieltes Einblenden von Personeninformationen aus früheren Erhebungen (etwa zeitbezogene Wohnbiographien), die die Befragten bis zum Interviewzeitpunkt fortschreiben. Ein Beispiel hierfür ist der Event History Calendar (EHC) im Deutschen Beziehungs- und Familienpanel (Pairfam).13

Erhebung von Paneldaten

Bei der Erhebung von Paneldaten muss sichergestellt sein, dass für Folgebefragungen und für die Analyse einzelne Individuen über die Zeit hinweg identifiziert werden können. Hierzu bedarf es der Generierung geeigneter individueller Identifikatoren, deren Zuordnung zu den Befragungspersonen aufgrund von Datenschutzanforderungen unbedingt getrennt von den eigentlichen Befragungsdaten zu speichern ist. Trotz dieser technischen Hürde bieten Panelstudien, wie eingangs angedeutet, verschiedene erhebungsbezogene Vorteile gegenüber Trendstudien.14 Erstens ist die Datenerhebung in der Regel kostengünstiger als im Trenddesign, da nicht in jeder Welle eine neue Stichprobe zu ziehen ist und bereits rekrutierte Befragte lediglich weiterverfolgt werden müssen. Zweitens erlauben bestehende Befragtenpanels bei Bedarf eine rasche Befragung ohne Stichprobenziehung (zum Beispiel nach einschneidenden historischen Ereignissen). Schließlich ermöglichen Panelstudien (ebenso wie Trendstudien) die Verteilung von Befragungsinhalten auf unterschiedliche Wellen und damit die Entzerrung der Untersuchung. Bei einem derartigen modularen Studiendesign ist allerdings gründlich zu überlegen, für welche – beispielsweise langsam veränderliche – Merkmale die dadurch entstehenden „Erhebungslücken“ aus theoretischer Sicht akzeptabel sind.

Abgesehen von ihren Vorteilen weisen Panelstudien aber auch spezifische methodische Probleme auf:15 So lernen die Befragten und auch die Interviewer_innen über die Zeit, wie sie (zum Beispiel durch bestimmte Antworten) die Befragungszeit verkürzen oder sich spezifische unangenehme Fragen sogar ganz ersparen können (Panel- bzw. Lerneffekte). Diese potenzielle Beeinflussung des Befragungsergebnisses durch frühere Wellen wird auch als „Panel Conditioning“ bezeichnet.16 Ein weiteres Problem resultiert aus der Konstanz der Messinstrumente, die zur Folge hat, dass sich die Bedeutung von Fragen in Fragebögen über die Zeit verändern kann: So ist beispielsweise der in den 1970er-Jahren verbreitete Ausdruck „in wilder Ehe leben“ heute kaum noch geläufig. Werden ältere Frageformulierungen beibehalten, bleibt zwar die rein äußerliche, dafür aber unter Umständen nicht die semantische Vergleichbarkeit über verschiedene Erhebungswellen erhalten. Bei einer Anpassung der Frageformulierungen wären hingegen die Fragen formal nicht mehr vergleichbar – ein Dilemma, das sich nicht vollständig lösen lässt.

Auswertung von Paneldaten

Das vielleicht wichtigste Potenzial von Paneldaten besteht, wie oben skizziert, in der Möglichkeit zur Durchführung von Kausalanalysen. Durch den Vergleich wiederholter Messungen innerhalb von Personen lassen sich etwa Veränderungen in Folge von Zustandsveränderungen (Ereignissen) quantifizieren. Werden statt der individuellen Merkmalsausprägungen ausschließlich Merkmalsveränderungen zueinander in Beziehung gesetzt, ergeben sich neue Möglichkeiten für Kausalschlüsse:17 Anstatt beispielsweise den (mittleren) Gesundheitszustand einer Gruppe von Verheirateten und von Geschiedenen miteinander zu vergleichen, kann man mit Paneldaten den Einfluss einer Zustandsveränderung (Übergang von Heirat zu Scheidung) auf die Veränderung der Gesundheit innerhalb derselben Personen analysieren.18 Dadurch wird sichergestellt, dass die Vergleichsgruppen – in diesem Fall: dieselben Personen vor und nach der Ehescheidung – hinsichtlich aller weitgehend unveränderlichen Dispositionen (Geschlecht, Persönlichkeit usw.) identisch sind – was beim Vergleich von unterschiedlichen Personengruppen nicht gilt. In diesem Fall könnten zum Beispiel unter den Geschiedenen Personen mit „ungünstigen“ Dispositionen überrepräsentiert sein, was nach den oben genannten Kausalitätsbedingungen zur Folge hätte, dass der Zusammenhang zwischen den Merkmalen „Scheidung“ und „Gesundheit“ nicht kausal interpretierbar wäre. Um derartige Verzerrungen zu vermeiden, werden in intraindividuellen Panelanalysen sämtliche – beobachtete und unbeobachtete – unveränderliche Merkmale statistisch konstant gehalten! Folglich können (aggregierte) intraindividuelle Veränderungen des Gesundheitszustands (etwa vor und nach einer Scheidung) im Panel mit größerer Wahrscheinlichkeit auf das Ereignis „Scheidung“ zurückgeführt werden als im herkömmlichen Gruppenvergleich. Freilich müssen dabei aber Veränderungen in zeitveränderlichen Merkmalen (beispielsweise im Einkommen), die möglicherweise kausal durch das Ereignis ausgelöst werden, stets in der Panelanalyse mitberücksichtigt werden.

Andererseits ergeben sich neben diesen Potenzialen auch einige Herausforderungen bei der Analyse von Paneldaten. Die wohl größte Schwierigkeit resultiert daraus, dass mit jeder Erhebungswelle in der Regel ein gewisser Schwund in der Stichprobe durch Nichterreichbarkeit von Befragten eintritt, etwa aufgrund von Umzug, Teilnahmeverweigerung oder Tod. Passend zu Letzterem wird bei derartigen Ausfällen allgemein von Panelmortalität (engl.: attrition) gesprochen.19 Insoweit als die Ausfälle nicht zufälliger, sondern systematischer Natur sind, also beispielsweise übermäßig häufig mobile jüngere Personen betreffen, führen sie mit der Zeit zu einer sinkenden Repräsentativität der Stichprobe. Das kann verzerrte Schlüsse bezüglich der Grundgesamtheit zur Folge haben: In einer Wahlstudie würden dann zum Beispiel Parteien, deren Wählerschaft jünger ist, mit der Zeit zu geringe Umfragewerte erhalten, während umgekehrt der Wähleranteil von Parteien mit älterer Wählerschaft überschätzt würde. Aber auch die Schätzung von Kausaleffekten kann durch Ausfälle systematisch verzerrt werden: Würden beispielsweise überproportional viele Geschiedene (aufgrund ihrer im Schnitt schlechteren Gesundheit) durch Tod aus der Stichprobe ausscheiden, so wären die gesünderen Geschiedenen in späteren Panelwellen überrepräsentiert, wodurch der abträgliche Kausaleffekt der Scheidung auf den Gesundheitszustand unter Umständen unterschätzt würde. Als Gegenmittel zu derartigen Effekten bieten sich Maßnahmen auf verschiedenen Ebenen an: Im Rahmen der Datenerhebung kann – außer bei wirklichen Todesfällen – einer steigenden Panelmortalität durch intensive Panelpflege (Adressdatenpflege, kleine Geschenke an die Teilnehmer_innen, Dankeskarten etc.) entgegengewirkt werden.20 In der Längsschnittdatenanalyse hingegen gibt es zum einen die Möglichkeit, Personen mit erhöhter Ausfallwahrscheinlichkeit in der Analyse stärker zu gewichten, zum anderen kann der Ausfallprozess neben den inhaltlich interessierenden Effekten explizit mitmodelliert und dadurch im Nachhinein berücksichtigt werden.21

Wichtige sozialwissenschaftliche Paneldatensätze

Die größte und am längsten (seit 1984) laufende Panelstudie in Deutschland ist das Sozio-oekonomische Panel (SOEP), in dem in jährlichem Turnus komplette Haushalte zu verschiedenen Lebensbereichen, insbesondere zu Arbeit und Beruf, aber auch zu Einstellungen und Werthaltungen, befragt werden. Das Deutsche Beziehungs- und Familienpanel (pairfam) umfasst Fragen zu Fertilität, Kindererziehung, Partnerschaften und Generationenbeziehungen. Seit 2008 wird jährlich eine Stichprobe aus mehreren Personen pro Familie (beide Partner, Kinder und Eltern) befragt. Die National Education Panel Study (NEPS) schließlich untersucht seit 2009 verschiedene Geburtsjahrgänge sowie Eltern, Lehrer_innen und Schulleitungen in unterschiedlichen Phasen des Bildungssystems und erhebt Daten zu Kompetenzentwicklung, sozialer Herkunft und individuellen Bildungsentscheidungen. Daneben existieren auch Paneldatensätze mit amtlichen Daten wie das Mikrozensus-Panel sowie sozialversicherungsbezogene Prozessdaten beim Institut für Arbeitsmarkt- und Berufsforschung (IAB) in Nürnberg.

Für internationale Vergleiche kann auf bereits harmonisierte länderübergreifende Paneldatensätze wie das Cross-Nation Equivalent File (CNEF) zurückgegriffen werden, welches Paneldaten aus Deutschland (SOEP), der Schweiz (SHP), England (BHPS), Russland (RLMS-HSE), USA (PSID), Kanada (SLID), Australien (HILDA) und Korea (KLIPS) enthält.

Insgesamt bieten Paneldaten, wie im Beitrag illustriert wurde, eine Reihe von Vorteilen gegenüber Querschnitt- und Trenddesigns, was sich in einem zunehmenden Angebot von Panelstudien zu verschiedenen Themen manifestiert. Angesichts ihrer Unverzichtbarkeit für die Untersuchung von Ursache-Wirkungs-Zusammenhängen in der sozialwissenschaftlichen Forschung22 steht zu erwarten, dass die Bedeutung von Paneldaten in Zukunft noch steigen wird.

Fußnoten

1 Rainer Schnell/Paul B. Hill/Elke Esser, Methoden der empirischen Sozialforschung, 10., überarb. Aufl., München 2013, S. 229.

2 Vgl. Paul F. Lazarsfeld, Panel Studies, in: The Public Opinion Quarterly 4 (1940), 1, S. 122–128.

3 Siehe Hans-Jürgen Andreß/Katrin Golsch/Alexander W. Schmidt, Applied Panel Data Analysis for Economic and Social Surveys, Berlin/Heidelberg 2013.

4 Andreas Diekmann, Empirische Sozialforschung. Grundlagen, Methoden, Anwendungen, Reinbek b. Hamburg 2007, S. 434.

5 Ausführlich dazu sowie zu weiteren Methoden der Untersuchung von Wählerwanderung vgl. Richard Hilmer/Michael Kunert, Wählerwanderung. Das Modell von Infratest dimap, in: Jürgen W. Falter/Oscar W. Gabriel/Bernhard Weßels (Hrsg.), Wahlen und Wähler. Analysen aus Anlass der Bundestagswahl 2002, Wiesbaden 2005, S. 134–156; Harald Schoen, Wählerwandel und Wechselwahl. Eine vergleichende Untersuchung, Wiesbaden 2003.

6 Siehe dazu Markus Gangl, Causal Inference in Sociological Research, in: Annual Review of Sociology 36 (2010), S. 21–47.

7 Vgl. u.a. Hans Benninghaus, Deskriptive Statistik. Eine Einführung für Sozialwissenschaftler, 11. Aufl., Wiesbaden 2007, S. 252.

8 Vgl. Paul F. Lazarsfeld, Die Interpretation statistischer Beziehungen als Forschungsoperation, in: Hans J. Hummell/Rolf Ziegler (Hrsg.), Korrelation und Kausalität, Bd. 1, Stuttgart 1976, S. 1–15, hier S. 6f.

9 Siehe Rainer Diaz-Bone, Statistik für Soziologen, 2. Aufl., Stuttgart 2013.

10 Vgl. dazu Lazarsfeld, Interpretation, S. 6.

11 Schnell/Hill/Esser, Methoden, S. 224.

12 Vgl. Nancy A. Mathiowetz/Katherine A. McGonagle, An Assessment of the Current State of Dependent Interviewing in Household Surveys, in: Journal of Official Statistics 16 (2000), 4, S. 401–418.

13 Siehe dazu Johannes Huinink et al., Panel Analysis of Intimate Relationships and Family Dynamics (pairfam). Conceptual Framework and Design, in: Zeitschrift für Familienforschung – Journal of Family Research 23 (2011), 1, S. 77–100.

14 Einen guten Überblick bietet Klaus Pforr/Jette Schröder, Warum Panelstudien? GESIS – Leibniz-Institut für Sozialwissenschaften 2015 (= GESIS Survey Guidelines).

15 Schnell/Hill/Esser, Methoden, S. 231.

16 Vgl. hierzu den gleichnamigen Soziopolis-Beitrag von Klaus Pforr.

17 Siehe Josef Brüderl, Kausalanalyse mit Paneldaten, in: Christof Wolf/Henning Best (Hrsg.), Handbuch der sozialwissenschaftlichen Datenanalyse, Wiesbaden 2010, S. 963–994.

18 Vgl. Marco Giesselmann/Michael Windzio, Regressionsmodelle zur Analyse von Paneldaten, Wiesbaden 2013, S. 40ff.

19 Diekmann, Sozialforschung, S. 308f.

20 Schnell/Hill/Esser, Methoden, S. 232.

21 Ebd., S. 305ff.

22 Vgl. Marco Giesselmann/Michael Windzio, Paneldaten in der Soziologie: Fixed Effects Paradigma und empirische Praxis in Panelregression und Ereignisanalyse, in: Kölner Zeitschrift für Soziologie und Sozialpsychologie 66 (2014), 1, S. 95–113.

Dieser Beitrag wurde redaktionell betreut von Kerstin Völkl.