Die Wohnregion von Befragten wird definiert als “… the region within the country of residence in which the person/household has his or her usual residence” (European Commission, 2020, S. 50). Das Merkmal Wohnregion basiert auf einem hierarchisch aufgebauten System der Raumgliederung. Prinzipiell können in Deutschland folgende Ebenen – von grob nach detailliert – unterschieden werden:
Die Wohnadresse erlaubt, neben einer Herleitung der jeweils gröberen Verwaltungsgebietseinheiten, eine kleinräumige Gliederung und die Zuweisung von Geokoordinaten, die nicht mehr nur eine Region, sondern einen Punkt auf einer Landkarte identifizieren. Dieser kann einem Quadrat in einem Raster (z.B. 100mx100m oder 1kmx1km; Bundesamt für Kartographie und Geodäsie, 2020) zugewiesen werden, um Umwelteinflüsse unabhängig von Verwaltungsgliederungen zu erfassen. Wohngemeinde, -ort und insbesondere die Wohnadresse werden aus Gründen der Datensparsamkeit jedoch seltener erfasst als das Bundesland und unterliegen, wenn sie erfasst werden, besonders strikten Datenzugangs- und Datennutzungsbedingungen.
Die „Demographischen Standards“ (Hoffmeyer-Zlotnik et al., 2024) enthalten keine Empfehlung für die Erhebung der Wohnadresse, der Wohngemeinde oder des Bundeslandes. Befragungen, die nicht mit einer Einwohnermeldeamts- oder Adressstichprobe arbeiten oder bei denen die Angaben aus dem Auswahlrahmen (sampling frame), z.B. einer die Grundgesamtheit repräsentierenden Liste, aus welcher die Stichprobe gezogen wird, nicht ausreichend exakt sind, müssen diese Informationen jedoch bei den Befragten einholen (Pfister et al., 2019). Der „Standardfragenkatalog zur Erhebung soziodemographischer und krisenbezogener Variablen“ (Rat für Sozial- und Wirtschaftsdaten, 2023) enthält Empfehlungen für die Erhebung der Postleitzahl und des Bundeslandes.
In diesem Abschnitt werden zunächst die im Standardfragenkatalog empfohlenen Fragebogenitems zur Erhebung der Postleitzahl und des Bundeslandes dargestellt. Diese soziodemographischen Standard-Fragebogenitems dienen der Vereinheitlichung der Stimuli bei der Erfassung soziodemographischer Merkmale mittels Fragebögen. Danach werden für dieses Merkmal zwei Standardvariablen vorgestellt, die über Datensätze hinweg konsistente Metadaten in Form standardisierter Variablennamen und -labels sowie Werte und Wertelabels spezifizieren. Soziodemographische Standardvariablen dienen der Vereinheitlichung soziodemographischer Variablen in (Umfrage)Daten im Sinne einer Output-Harmonisierung. Standarditems und Standardvariablen ergänzen einander und haben zum Ziel, die Messung soziodemographischer Merkmale über Datensätze hinweg vergleichbar und leichter nutzbar zu machen. Weitergehende Informationen zu soziodemographischen Standarditems und -variablen finden sich in Schneider et al. (2023).
1.1 Standart-Fragebogenitem
Die Wohnregion kann grob durch die Frage nach dem Bundesland, in dem der*die Befragte wohnt, oder detailliert durch die Frage nach Postleitzahl und Wohnort erfragt werden. Der Standardfragenkatalog (Rat für Sozial- und Wirtschaftsdaten, 2023) enthält nur Standardfragen für Postleitzahl und Bundesland. Tabelle 1 zeigt die grundlegenden Eigenschaften dieser Fragebogenitems im Überblick:
Tabelle 1: Eigenschaften der Erhebungsinstrumente für das Merkmal Wohnregion
Nr. |
Merkmal |
offen/halboffen/ geschlossen |
numerisch/ kategorial |
Antwort-kategorien/-format |
Einfach- /Mehrfach-antwort |
GEO_1 |
Postleitzahl des Wohnortes |
offen (computergestützt: geschlossen**) |
numerisch |
5-stellig |
|
GEO_2 |
Bundesland des Wohnortes |
geschlossen |
kategorial |
16 |
einfach |
* In computergestützten Befragungen empfiehlt sich die Einbindung einer Postleitzahlen-Datenbank, damit nur gültige Zustellpostleitzahlen angegeben werden können. Dadurch wird dies eine geschlossene Frage mit einer großen Anzahl an Antwortkategorien. |
Tabelle 2 zeigt die empfohlenen Fragebogenitems zur Erfassung der Postleitzahl (des Wohnorts) und des Bundeslandes im Standardfragenkatalog (Rat für Sozial- und Wirtschaftsdaten, 2023, S. 16):
Tabelle 2: Items zur Erfassung der Postleitzahl und des Bundeslandes im RatSWD-Standardfragenkatalog
GEO_1 |
Wie lautet die Postleitzahl Ihres Wohnorts? |
Antwort (offen oder Liste auf Basis einer Datenbank): _ _ _ _ _ -1. Weiß nicht -2. Keine Angabe -3. Trifft nicht zu (wohne nicht in Deutschland) |
|
GEO_2 |
In welchem Bundesland wohnen Sie? |
-1. Weiß nicht -2. Keine Angabe -3. Trifft nicht zu (wohne nicht in Deutschland) |
Eine Erfragung der Postleitzahl allein reicht jedoch nicht aus, um die Wohngemeinde zu identifizieren und daraus das Bundesland (oder den Landkreis) herleiten zu können: die gleiche Postleitzahl ist häufig mehreren Wohngemeinden zugewiesen und viele Postleitzahlen überschreiten die Grenzen von Landkreisen und in einigen wenigen Fällen sogar Bundesländern. Außerdem entstehen bei der alleinigen Nennung der Postleitzahl leicht Fehler („Zahlendreher“), die durch eine gleichzeitige Abfrage des Wohnorts aufgedeckt und korrigiert werden können.
Die Möglichkeiten der Zuspielung von Regionaldaten sind außerdem stärker eingeschränkt, wenn nur die Postleitzahl vorliegt. Ebenso wenig kann allein nach dem Wohnort gefragt werden, da viele Namen von Wohnorten in Deutschland mehrfach vorkommen (Pfister et al., 2019, S. 53). Daher empfiehlt sich, zusätzlich zur Postleitzahl den Wohnort zu erfassen, um den amtlichen Gemeindeschlüssel (AGS) kodieren zu können, anhand dessen eine Vielzahl weiterer Merkmale (darunter auch Landkreis und Bundesland) hergeleitet und entsprechend weitere Regionaldaten zugespielt werden können. Bei Eingabe der Postleitzahl durch den*die Befragte*n in ein Textfeld in computergestützten Befragungen können dann alle Gemeinden mit dieser Postleitzahl angezeigt werden und der*die Befragte kann die passende Gemeinde aus der Trefferliste auswählen.
Wird nach Postleitzahl und Wohnort gefragt, muss normalerweise nicht zusätzlich nach dem Bundesland gefragt werden. Die Frage nach Postleitzahl und Wohnort könnte jedoch Widerstand provozieren, da diese Informationen datenschutzrechtlich sensibel sind. Insbesondere in Online-Befragungen ist mit einer erhöhten Rate fehlender Angaben zu rechnen, so dass eine zusätzliche Erfassung des Bundeslandes ratsam ist (Pfister et al., 2019, S. 69).
Zusammenfassend sollte mindestens nach dem Bundesland des Wohnorts, und wenn möglich nach Postleitzahl und Wohnort gefragt werden. Die Fragen können alle entfallen, wenn die regionale Information aus der Auswahlgrundlage hergeleitet werden kann. Das ist bei Einwohnermeldeamtsstichproben, die in wissenschaftlichen Studien häufig für persönliche Befragungen verwendet werden, immer der Fall. Eine Übersicht über die Notwendigkeit der Erfassung geographischer Merkmale je nach Auswahlrahmen und Befragungsmodus findet sich in Pfister et al. (2019, S. 54).
Die Fragebogenitems im Standardfragenkatalog des RatSWD können für alle Befragungsmodi angewendet werden, wobei Optimierungen für verschiedene Befragungsmodi möglich sind, insbesondere bezüglich der Einbindung unterstützender Datenbanken. In der Frage nach der Postleitzahl des Wohnortes wird darauf hingewiesen, dass die Frage offen oder geschlossen, unter Einbindung einer Datenbank, gestellt werden kann. Die geschlossene Frage bietet bei computergestützten Befragungen eine standardisierte und auf Plausibilität geprüfte Erfassung. Hierzu muss der Fragebogen so programmiert werden, dass sich die Datenbank durch das Eingabefeld filtern lässt, so dass Befragte nach Eingabe der Postleitzahl nur Wohnorte mit dieser Postleitzahl angezeigt bekommen und – falls es überhaupt mehrere Wohnorte mit dieser Postleitzahl gibt – nur noch aus dieser kurzen Liste den richtigen Eintrag auswählen müssen. Dazu muss die Datenbank auf Zustellpostleitzahlen (z.B. ohne Postfach-Postleitzahlen) eingegrenzt werden. Als Urheber der Postleitzahlen bietet die Deutsche Post ein regelmäßig aktualisiertes kommerzielles Angebot; es gibt aber auch kostenfreie Angebote auf der Basis von OpenStreetMap.
Die Frage nach der Wohnregion wird auch in internationalen Umfragen verwendet. Die zur Operationalisierung der Wohnregion gewählte administrative Einheit ist jedoch länderspezifisch und orientiert sich in der Regel an einer Gebietsebene, auf die sich auch die amtliche Statistik des Landes bezieht. Daher kann die Frage auch nicht einfach übersetzt werden, sondern erfordert eine länderspezifische Anpassung sowohl der Frageformulierung als auch der Antwortkategorien. Internationale Umfrageprogramme geben den teilnehmenden Ländern oft vor, nach welchem internationalen Standard bzw. auf welcher Aggregationsebene die Wohnregion erfasst werden soll (bspw. Gemeinde, Kreis, Regierungsbezirk oder Bundesland im Fall von Deutschland). Auf europäischer Ebene wird häufig die NUTS-Systematik (Nomenclature des unités territoriales statistiques, Eurostat, 2022) verwendet. NUTS ist eine amtliche, hierarchische und auf Verwaltungseinheiten basierende Klassifikation aller Regionen in der EU. Als EU-Klassifikation ist sie jedoch nicht für nicht-europäische Länder verfügbar. Auf internationaler Ebene über die EU hinaus werden andere Standards verwendet. Die OECD-„Territorial levels“ (OECD, 2022) gelten für die 38 Mitgliedstaaten der OECD und sind für EU-Länder in ihrer Struktur und administrativen Gliederung der NUTS sehr ähnlich. Der umfassendste Standard für die Regionalisierung von Ländern weltweit ist das ISO-3166-Codeschema, das jenseits der Kennzeichnung der Länder selbst auch Regionen innerhalb der Länder (country-subdivisions) differenziert. Bei der Verwendung der ISO-Regionalklassifikation als Grundlage für eine Regionalvariable in ländervergleichenden Studien ist zunächst zu beachten, dass die Anzahl oder Größe der Verwaltungsebenen, die für jedes Land als Region kodiert werden, nicht festgelegt ist und sich daher stark zwischen den Ländern unterscheidet. Darüber hinaus geht aus dem Code nicht immer eindeutig hervor, dass die Regionalklassifikation mehrere Ebenen umfasst, d. h. der Code ist nicht immer hierarchisch aufgebaut, so dass die verschiedenen Ebenen manchmal nicht systematisch unterschieden werden können.
Für die europäischen Länder empfiehlt Eurostat (2007) die Erhebung der Wohnregion auf der NUTS-2-Ebene, was in Deutschland den Regierungsbezirken entspricht. Da der Regierungsbezirk, dem der Wohnort zugehört, nicht ausreichend bekannt ist, wird in Deutschland nach Postleitzahl und Wohnort gefragt, um die NUTS-2-Ebene herleiten zu können. Für nicht-europäische Länder gibt es keine Empfehlung.
Die hier vorgestellten Fragebogenitems können für alle Befragten und in jedem Befragungsmodus genutzt werden; zu Anpassungen für verschiedene Modi s. Abschnitt „Anpassung an verschiedene Befragungsmodi“. Jedoch können die Fragen entfallen, wenn die entsprechenden Informationen schon aus dem Auswahlrahmen bekannt sind (s.o.).
Um die Wohnregion über (deutsche) Studien und im Zeitverlauf einheitlich benennen, kodieren und damit besser vergleichen zu können und (Umfrage-)Daten möglichst leicht Regionaldaten zuspielen zu können, wurden die Standardvariablen x_region_ags und x_region_nuts entwickelt. Diese wurden nur für auf Deutschland bezogene Daten entwickelt, wobei x_region_nuts prinzipiell auch für Daten, die sich auf EU-Länder beziehen, angewendet werden kann.
Die Standardvariable x_region_ags ist als sechsstellige numerische Variable angelegt und differenziert Ost- und Westdeutschland, Bundesländer und Landkreise/kreisfreie Städte anhand des sog. Kreisschlüssels (Codeliste erhältlich unter Statistisches Bundesamt, 2021). Dieser ist Teil des deutschen „Amtlichen Gemeindeschlüssels“ (AGS) und verwendet damit eine nationale Systematik. Die ersten zwei Stellen des AGS entsprechen den Bundesländern (Codeliste erhältlich unter Statistisches Bundesamt, 2010), die Stellen drei bis fünf den Landkreisen und kreisfreien Städten (Statistisches Bundesamt, 2021). Diese Schlüssel sind in den Postleitzahl- und Wohnort-Datenbanken der Deutschen Post und auf Basis von OpenStreetMap (s.o.) enthalten, und können zur Übertragung der Fragebogendaten in die Standardvariable genutzt werden. Den fünf Stellen des Kreisschlüssels wird in x_region_ags eine zusätzliche erste Stelle zur Unterscheidung zwischen Ost- und Westdeutschland vorangestellt, wobei eine Unterscheidung des früheren Westberlins entfällt und Berlin in Gänze Ostdeutschland zugeordnet wird. Diese Stelle wird genutzt, falls in einer Studie nur bekannt ist, ob die Person in West- oder Ostdeutschland lebt, bzw. aus Datenschutzgründen nur diese Information verfügbar gemacht werden kann. Um Umfragedaten mit regionalen Kontextdaten anzureichern, für die als Schlüssel AGS-kodierte Bundesländer oder Landkreise/kreisfreie Städte vorliegen, muss eine neue Variable generiert werden, in der diese erste Stelle entfällt.
Für europäische ländervergleichende Daten und die Zuspielung von Regionaldaten, die nach NUTS kodiert vorliegen, ist die Codierung der Wohnregion nach der amtlichen europäischen NUTS-Klassifikation geeignet. Die Standardvariable x_region_nuts basiert auf der NUTS Klassifikation (für NUTS 2021: Eurostat, 2022) und ist eine alphanumerische (string) Variable mit fünf Zeichen. „Die NUTS-Regionen sind hierarchisch strukturiert, gliedern sich in 3 Ebenen und orientieren sich an den Verwaltungseinheiten der Mitgliedsstaaten. Für Deutschland sind dies NUTS1: Bundesländer, NUTS2: Regierungsbezirke und NUTS3: Kreisfreie Städte und Landkreise“ (Statistisches Bundesamt, 2020, S. 15). Das vollständige Schema von NUTS 2024 mit NUTS-Ebenen 2 und 3 für alle europäischen Länder inklusive einer Übersicht aller Änderungen im Vergleich zu NUTS 2021 lässt sich als Excel-Datei hier herunterladen. Korrespondenztabellen von Postleitzahlen zu NUTS3-Codes für alle NUTS-Versionen sind bei Eurostat verfügbar (European Commission, 2023), eine Korrespondenztabelle von deutschem Kreisschlüssel (erste fünf Stellen des AGS, s.o.) zu NUTS3-Codes (mit Bezug auf NUTS 2021) liegt beim statistischen Bundesamt vor (Destatis, 2022).
Da die Codeschemata beider Variablen, x_region_ags und x_region_nuts, hierarchisch aufgebaut sind, können alle regionalen Ebenen, je nach Verfügbarkeit in den Daten und datenschutzrechtlichen Möglichkeiten, abgelegt werden. Die abgebildete Ebene ergibt sich dann aus der Anzahl der Stellen der jeweiligen Variable in den Daten. Beispielsweise beschreibt ein dreistelliger Code auf x_region_ags ein Bundesland, und ein sechsstelliger Code einen Landkreis bzw. eine kreisfreie Stadt. Letzteres lässt sich durch Trunkierung leicht in ersteres überführen. Ähnlich verhält es sich bei NUTS-Codes.
Die Grenzen und die Zusammensetzung der Verwaltungseinheiten innerhalb eines Landes können sich auf allen Ebenen immer wieder ändern. Daher werden die den Standardvariablen zugrunde liegenden regionalen Klassifikationen gelegentlich aktualisiert – der AGS mehrmals im Jahr in unregelmäßigen Abständen, und NUTS etwa alle drei Jahre. Dies betrifft v.a. die hier nicht verwendete Gemeindeebene, manchmal aber auch die Kreisebene (und international dann auch häufiger die NUTS-1-Ebene). Dies erschwert die Vergleichbarkeit und Harmonisierung der Wohnregionen im Zeitablauf und macht die Angabe des verwendeten Gebietsstandes in den Standardvariablen unerlässlich. Dazu sollen Suffixe im Variablennamen verwendet werden, die das Jahr (YY) und im Falle von x_region_ags auch den Monat (YYMM) des verwendeten Gebietsstandes transparent machen, und die Labels entsprechend angepasst werden. Wird also beispielsweise die Standardvariable x_region_ags mit Regionalcodes auf Kreisebene und nicht nur auf Bundeslandebene angelegt, sollen Variablenname und -label Versionsmonat und -jahr der AGS des jeweiligen Jahres und Monats nach folgendem Muster enthalten: x_regions_agsYYMM, wobei YY durch das konkrete Jahr und MM durch den konkreten Monat der AGS-Version zu ersetzen sind. Die Standardvariable wird entsprechend als „Region of residence (AGS YYMM)“ bzw. „Wohnregion (AGS JJMM)“ gelabelt. Eine Liste aller AGS-Codes inclusive historischer Codes steht hier (Statistisches Bundesamt, 2024) zur Verfügung. Für x_region_nuts wird der Variablenname entsprechend angepasst zu x_region_nutsYY, wobei YY durch das Jahr der NUTS-Version zu ersetzen ist, und das Label „Region of residence (NUTS YYYY)“ bzw. „Wohnregion (NUTS JJJJ)“ mit der jeweiligen NUTS-Version als Jahreszahl verwendet. Es gibt ein Tool zur Konvertierung von NUTS Codes zwischen Versionen (aktuell bis inkl. 2021, Joint Research Centre, 2022).
Tabelle 3 (inklusive der möglichen Suffixe für die Versionen der zugrundeliegenden Gebietsklassifikationen) für die Wohnregion auf. In Tabelle 4 wird das Codeschema für die Standardvariable x_region_ags und in Tabelle 5 für die Variable x_region_nuts21 dargestellt, jeweils beschränkt auf die Ebene der Bundesländer und mit Bezug auf das Fragebogenitem GEO_2 (s. Tabelle 2).
Tabelle 3: Spezifikation der Standardvariablen zur Wohnregion
Variablenname |
Variablenlabel DE |
Variablenlabel EN |
Format |
Version |
x_region_agsYYMM |
Wohnregion (AGS JJMM) |
Region of residence (German standard AGS YYMM) |
kategorial - numerisch |
1.0.1 |
x_region_nutsYY |
Wohnregion (NUTS JJJJ) |
Region of residence (NUTS YYYY) |
kategorial - string |
1.0.1 |
Anmerkung: Werden in der Variablen x_region_agsYYMM nur Information auf der Ebene der Bundesländer angelegt kann das Suffix YYMM entfallen. |
Tabelle 4: Codeschema für die Standardvariable x_region_ags und Zuordnung der Antwortmöglichkeiten des Items GEO_2 im Standardfragenkatalog des RatSWD
Standardvariable x_region_ags, Version 1.0 |
RatSWD 2023, Frage GEO_2 |
|||
Code |
Wertelabels DE |
Wertelabels EN |
Code |
Wertelabel |
100 |
Westdeutschland, nfs |
West Germany, nfs |
|
|
101 |
Schleswig-Holstein |
Schleswig-Holstein |
15 |
Schleswig-Holstein |
102 |
Hamburg |
Hamburg |
6 |
Hamburg |
103 |
Niedersachsen |
Lower Saxony |
9 |
Niedersachsen |
104 |
Bremen |
Bremen |
5 |
Bremen |
105 |
Nordrhein-Westfalen |
North Rhine-Westphalia |
10 |
Nordrhein-Westfalen |
106 |
Hessen |
Hesse |
7 |
Hessen |
107 |
Rheinland-Pfalz |
Rhineland-Palatinate |
11 |
Rheinland-Pfalz |
108 |
Baden-Württemberg |
Baden-Württemberg |
1 |
Baden-Württemberg |
109 |
Bayern |
Bavaria |
2 |
Bayern |
110 |
Saarland |
Saarland |
12 |
Saarland |
200 |
Ostdeutschland, nfs |
East Germany, nfs |
|
|
211 |
Berlin |
Berlin |
3 |
Berlin |
212 |
Brandenburg |
Brandenburg |
4 |
Brandenburg |
213 |
Mecklenburg-Vorpommern |
Mecklenburg-Vorpommern |
8 |
Mecklenburg-Vorpommern |
214 |
Sachsen |
Saxony |
13 |
Sachsen |
215 |
Sachsen-Anhalt |
Saxony-Anhalt |
14 |
Sachsen-Anhalt |
216 |
Thüringen |
Thuringia |
16 |
Thüringen |
Tabelle 5: Codeschema für die Standardvariable x_region_nuts21 (hier nur NUTS1 dargestellt) und Zuordnung der Antwortmöglichkeiten des Items GEO_2 im Standardfragenkatalog des RatSWD
Standardvariable x_region_nuts21, Version 1.0 (NUTS 2021) |
RatSWD 2023, Frage GEO_2 |
|||
Code |
Wertelabels DE |
Wertelabels EN |
Code |
Wertelabel |
DE1 |
Baden-Württemberg |
Baden-Württemberg |
1 |
Baden-Württemberg |
DE2 |
Bayern |
Bavaria |
2 |
Bayern |
DE3 |
Berlin |
Berlin |
3 |
Berlin |
DE4 |
Brandenburg |
Brandenburg |
4 |
Brandenburg |
DE5 |
Bremen |
Bremen |
5 |
Bremen |
DE6 |
Hamburg |
Hamburg |
6 |
Hamburg |
DE7 |
Hessen |
Hesse |
7 |
Hessen |
DE8 |
Mecklenburg-Vorpommern |
Mecklenburg-Vorpommern |
8 |
Mecklenburg-Vorpommern |
DE9 |
Niedersachsen |
Lower Saxony |
9 |
Niedersachsen |
DEA |
Nordrhein-Westfalen |
North Rhine-Westphalia |
10 |
Nordrhein-Westfalen |
DEB |
Rheinland-Pfalz |
Rhineland-Palatinate |
11 |
Rheinland-Pfalz |
DEC |
Saarland |
Saarland |
12 |
Saarland |
DED |
Sachsen |
Saxony |
13 |
Sachsen |
DEE |
Sachsen-Anhalt |
Saxony-Anhalt |
14 |
Sachsen-Anhalt |
DEF |
Schleswig-Holstein |
Schleswig-Holstein |
15 |
Schleswig-Holstein |
DEG |
Thüringen |
Thuringia |
16 |
Thüringen |
Die Wohnregion kann in Dummy-Variablen überführt werden, die dann als unabhängige Variablen in Regressionsmodellen als sog. „fixed effects“ eingesetzt werden können (Möhring, 2012). Dazu sind beide Standardvariablen gleichermaßen geeignet, da sich nur die Art der Codes, nicht aber der Inhalt unterscheidet. Wenn eine große Anzahl an Regionen vorliegt (> 30), d.h. wenn nicht nur Deutschland analysiert wird, oder wenn Regierungsbezirke (NUTS2) oder Kreisfreie Städte und Landkreise (NUTS3) identifiziert werden, ist ihre Nutzung als eigene Analyseebene in Mehrebenenanalysen (z.B. Bryk & Raudenbush, 1992; Snijders & Bosker, 1999) sinnvoller. Variablen, die Wohnort bzw. Wohnregion identifizieren, sind jedoch vor allem als Verknüpfungsvariablen zur Zuspielung von Regionaldaten nützlich. Diese können dann als Prädiktoren in Regressionsmodelle, insbesondere auf der entsprechenden Analyseebene in Mehrebenenmodelle, eingehen.
Regionen sind geographische Einheiten, die, nach einer zweckmäßigen Aufteilung, eindeutig identifizierbar und anhand ausgewählter Strukturmerkmale miteinander vergleichbar sind. Während strukturelle Merkmale eine wichtige Rolle in politischen Entscheidungen über Ressourcenverteilung spielen, ist für die Sozialforschung die sekundäre Nutzung der amtlichen Statistiken auf regionaler Basis interessant: diese Daten ermöglichen die Analyse über den Einfluss der regionalen Strukturunterschiede auf das Verhalten und die Einstellungen der Individuen, die dort leben (Hoffmeyer-Zlotnik & Sodeur, 2019). Eine wichtige Art der Fragestellung in den Sozialwissenschaften besteht darin, „inwieweit die Einheiten auf der „Mikroebene“ durch ihre Umgebungen („Makroebene“) in ihren Handlungsspielräumen beziehungsweise in ihrem tatsächlichen Handeln beeinflusst werden“ (Hoffmeyer-Zlotnik & Sodeur, 2019, S. 30). Individuen sind durch ihren Wohnort in regionale Kontexte auf unterschiedlichen Ebenen eingebettet: in die direkte Nachbarschaft (die über Straße und Hausnummer ermittelt werden kann, resultierend in einer Geokoordinate), die Wohngemeinde (ermittelt aus Postleitzahl und Wohnort), den Landkreis, den Regierungsbezirk, das Bundesland, Ost- und Westdeutschland, und zu guter Letzt Deutschland. Eigenschaften regionaler Kontexte können geographische, soziale, wirtschaftliche und politische Faktoren sein, die das Erleben und Verhalten sowie die sozialen Beziehungen von Individuum direkt oder indirekt beeinflussen. Beispielhafte Kontextmerkmale sind das Wohlstands- oder Arbeitslosigkeitsniveau einer Region, die Verfügbarkeit bestimmter Ressourcen (z.B. Wohnraum, Bildungseinrichtungen) oder Kontaktmöglichkeiten (bspw. durch Bevölkerungsstruktur und Anteil Zugewanderter), die Bevölkerungsdichte oder der Verstädterungsgrad. Die Einflussnahme kann dabei direkt, z.B. durch Gesetze, Ausübung von Macht, (Des-)Information, Handlungsspielräume (Opportunitäten und Restriktionen), oder indirekt, z.B. durch die individuelle Orientierung an Bezugsgruppen, Anpassung an Normen oder die individuelle Wahrnehmung von Gelegenheiten zustande kommen. Hoffmeyer-Zlotnik und Sodeur unterscheiden Hummell (1972) folgend vier theoretische Erklärungsansätze für Zusammenhänge zwischen regional vermittelten Kontextmerkmalen und den in diesen Regionen lebenden Individuen:
Wohnort und -region sind somit keine soziodemographischen Hintergrundmerkmale, die einen eigenen Erklärungswert haben und statistisch kontrolliert werden müssen, sondern Schlüsselvariablen, anhand derer den Befragten einer Umfrage eine Vielzahl von Informationen über ihr soziales Umfeld und ihre regionale Verortung (insbes. sogenannte Regionaldaten) als kontextuelle Hintergrundvariablen zugespielt werden können. Aus dem Wohnort lassen sich alle weiteren (administrativen, aber auch viele nicht-administrative) Ebenen mit Ausnahme der kleinräumigeren Ebenen (bspw. Nachbarschaftsebene) herleiten, so dass der Erfassung des Wohnorts eine zentrale Bedeutung zukommt. Welche Art und Ebene des regionalen Kontexts zu erfassen ist, ergibt sich aus der konkreten Forschungsfrage bzw. -hypothese.
3.1 Konstruktion der Standarditems
Eine Empfehlung zur Messung des Wohnortes oder des Bundeslandes fehlte in der ZUMA-Standarddemographie (Pappi, 1979, Anhang A) und ebenso seither in den Demographischen Standards. Sie ist jedoch im Standardfragenkatalog des RatSWD (Rat für Sozial- und Wirtschaftsdaten, 2023) enthalten (s. dazu auch Abschnitt „Instrument“), da dieser stärker auf die Bedarfe von Onlinebefragungen eingeht, die meist nicht auf entsprechende Informationen aus dem Auswahlrahmen zurückgreifen können. Dort und in der begleitenden Handreichung (RatSWD, 2022) sind keine Quellen für die Items angegeben. Die regionalen Gliederungssystematiken sind detailliert in den Regionalen Standards (Behrens et al., 2019) dargestellt.
3.2. Konstruktion und Selektion der Standardvariablen
Die beiden Standardvariablen für die Wohnregion wurden 2022/2023 im KonsortSWD-Teilprojekt TA3-M1 „Harmonized Variables – Umfragedaten leichter kombinieren durch standardisierte und harmonisierte Variablen“ entwickelt. Beide Variablen haben prinzipiell den gleichen Informationsgehalt, sind jedoch unterschiedlich kodiert. Die erste Standardvariable, x_region_ags, verwendet die ersten fünf Stellen des „Amtlichen Gemeindeschlüssels“ (AGS) der deutschen amtlichen Statistik und eignet sich somit für Analysen im deutschen Kontext bzw. die Zuspielung von Regionaldaten auf Kreisebene (Stellen zwei bis fünf) oder auf Bundeslandebene (Stellen zwei und drei). Vorangestellt ist hier ein Code zur Unterscheidung von West- und Ostdeutschland. Die zweite Standardvariable, x_region_nuts, nutzt die NUTS Klassifikation (für NUTS 2021 s. Eurostat, 2022) und ist damit auf europäischer Ebene anschlussfähig und nutzbar, wenn zuzuspielende Regionaldaten mit NUTS-Codes verknüpft sind. Beide Variablen können unterschiedlich stark aggregiert (bzw. trunkiert) werden, um Datenschutz zu gewährleisten, Veränderungen in Gebietsständen insbesondere auf den unteren Ebenen sind aber bei beiden zu berücksichtigen und Versionen ggf. kenntlich zu machen.
Im Allgemeinen führen Standarditems und Standardvariablen zu einer Erhöhung der Durchführungs- und Auswertungsobjektivität – vor allem über verschiedene Studien hinweg. So tragen Standarditems durch die Harmonisierung der Frage zu einer standardisierten Durchführung bei. Standardvariablen führen durch ihr standardisiertes Codeschema zu einer objektiven Auswertung. Zusammengefasst erhöhen die hier vorgestellten Standarditems und Standardvariablen die Unabhängigkeit in der Erfassung der Wohnregion von den spezifischen Forschenden.
Bei der Wohnregion handelt es sich um ein potenziell objektiv messbares Merkmal, welches jedoch subjektiv, durch Angaben der Befragten, erhoben wird. Es besteht somit die Möglichkeit, dass die subjektive Angabe vom objektiven Wert abweicht (d.h. eine Person gibt nicht das richtige Bundesland an).
Da soziodemographische Merkmale typischerweise mit nur einem Item pro Merkmal gemessen werden, sind psychometrische Verfahren zur Reliabilitätsschätzung nicht anwendbar. Eine Einschätzung der Reliabilität über Test-Retest-Verfahren ist prinzipiell möglich, wird aber nur selten durchgeführt (s. bspw. Porst & Zeifang, 1987). Uns ist keine Studie zur Erfassung der Reliabilität des Merkmals „Wohnregion“ bekannt. Die Frage nach dem Bundesland, in dem der Wohnort liegt, ist für Personen, die noch nicht lange in Deutschland leben oder die kürzlich umgezogen sind, vermutlich schwieriger zu beantworten als für andere. Sie wird in diesen Subpopulationen möglicherweise mit geringerer Reliabilität gemessen als im Rest der Bevölkerung. Der Regierungsbezirk sollte mangels Bekanntheit unter Befragten immer aus einer detaillierteren Gebietsinformation hergeleitet und nie erfragt werden.
Da die Standardvariablen zur Wohnregion administrative Regionen widerspiegeln und vorrangig als Schlüsselvariablen zur Zuspielung von Regionaldaten verwendet werden, erübrigt sich eine Validierung.
Für die meisten Befragten dürften die Fragen nach Wohnort und Bundesland leichte Fragen sein, wenn auch die Frage nach dem Wohnort als sensible Frage betrachtet werden sollte (s.o). Uns sind keine Ergebnisse kognitiver Pretests dieser Fragen bekannt.
Danksagung
Wir danken Christiane Heckel, Verena Ortmanns und Dorothée Behr für ihr Feedback zu einem Entwurf dieses Beitrags.
Silke Schneider, GESIS – Leibniz-Institut für Sozialwissenschaften in Mannheim, Silke.Schneider@gesis.org