1 Überblick

 

Zusammenfassung

Der Penn State Worry Questionnaire (PSWQ; Meyer et al. 1990) soll in Übereinstimmung mit dem "Diagnostic and Statistical Manual of the American Psychiatric Association" (DSM III; APA 1987) exzessives, unrealistisches Sorgen als zentrales kognitives Begleitsyndrom einer generalisierten Angststörung (GAD) erfassen. Im DSM IV (1994) wurde diese Explikation so erweitert, dass exzessives Sorgen zusätzlich als unkontrollierbar erlebt werden muss. Entsprechend sollen die PSWQ Items auch diese Sorgenfacette operationalisieren. Stöber (1995) entwickelte und prüfte erstmals eine deutsche Version des PSWQ. Wie das englische Original enthält sie elf Items, die eine Sorgentendenz ausdrücken und fünf Items, die diese negieren bzw. deren Kontrollierbarkeit erfragen.

 

Zitierung

Glöckner-Rist, A. & Rist, F. (2014). Deutsche Version des Penn State Worry Questionnaire (PSWQ-d). Zusammenstellung sozialwissenschaftlicher Items und Skalen. doi:10.6102/zis219

Titel: Deutsche Version des Penn State Worry Questionnaire (PSWQ-d)

Autor/in: Glöckner-Rist & Rist

In ZIS seit: 2006

Anzahl der Items: 16

Reliabilität: keine Angaben

Validität: Daten zur Beurteilung der Kriterien- und Konstruktvalidität liegen vor

Konstrukt: Generalisierte Angststörung, kognitives Begleitsyndrom, exzessives Sorgen

Schlagwörter: Sorge, Angst, Kontrolle

Sprache Dokumentation: deutsch

Sprache Items: deutsch

Item(s) in Bevölkerungsumfrage eingesetzt: nein

Entwicklungsstand: validiert

2 Instrument

 

Instruktion

Im Folgenden sehen Sie eine Reihe von Aussagen. Bitte geben Sie an, wie typisch diese Aussagen für Sie sind (überhaupt nicht typisch für mich, nur wenig typisch für mich, ziemlich typisch für mich, sehr typisch für mich, äußerst typisch für mich).

Kreuzen Sie bitte pro Aussage nur ein Kästchen an und lassen Sie keine Aussage aus. Antworten Sie möglichst spontan auf jede Frage, ohne lange zu überlegen. Dies ist kein Test, das heißt es gibt weder falsche noch richtige Antworten.

 

Items

Nr.

Item

Polung

1

Wenn ich nicht genug Zeit habe, alles zu erledigen, mache ich mir darüber keine Sorgen.

-

2

Meine Sorgen wachsen mir über den Kopf.

+

3

Ich neige nicht dazu, mir über Dinge Sorgen zu machen.

-

4

Viele Situationen machen mir Sorgen.

+

5

Ich weiß, ich sollte mir keine Sorgen machen, aber ich kann nichts dagegen machen.

+

6

Wenn ich unter Druck stehe, mache ich mir viel Sorgen.

+

7

Über irgendetwas mache ich mir immer Sorgen.

+

8

Mir fällt es leicht, sorgenvolle Gedanken zu vertreiben.

-

9

Sobald ich eine Aufgabe beendet habe, fange ich an, mir über all das Sorgen zu machen, was ich sonst noch tun muss.

+

10

Ich mache mir nie über etwas Sorgen.

-

11

Wenn ich in einer Angelegenheit nichts mehr tun kann, mache ich mir auch keine Sorgen mehr darüber.

-

12

Ich war schon immer jemand, der sich viel Sorgen macht.

+

13

Mir fällt auf, dass ich mir über einiges Sorgen gemacht habe.

+

14

Wenn ich erst einmal anfange, mir Sorgen zu machen, kann ich nicht mehr damit aufhören.

+

15

Ich mache mir die ganze Zeit über Sorgen.

+

16

Ich mache mir über Vorhaben so lange Sorgen, bis sie komplett erledigt sind.

+

 

Antwortvorgaben

5-stufiges Antwortformat mit den Optionen: überhaupt nicht typisch für mich (1), nur wenig typisch für mich (2), ziemlich typisch für mich (3), sehr typisch für mich (4), äußerst typisch für mich (5).

 

 

Auswertungshinweise

Der PSWQ-d enthält elf Items, die eine Sorgentendenz ausdrücken und fünf Items, die diese negieren bzw. deren Kontrollierbarkeit erfragen. Der PSWQ umfasst somit Aussagen, die positiv und negativ in Richtung auf das zu erfassende Zielmerkmal einer pathologischen Sorgentendenz formuliert bzw. gepolt sind. Zustimmende bzw. nicht zustimmende Antworten zu diesen auch als Pro- und Kontra-Items bezeichneten Aussagen indizieren hohe Ausprägungen auf dem Zielmerkmal. Eine Umpolung der Kontra-Items ist zwar erforderlich, wenn konventionelle Indizes wie Cronbachs Alpha zur Prüfung der internen Konsistenz der PSWQ-Items berechnet werden. Sie ist aber nicht erforderlich bzw. sollte unterbleiben, wenn dem Datenniveau angemessene Auswertungsmethoden eingesetzt werden, wie die hier herangezogenen 2 Parameter IRT Normalogiven Modelle.

 

Anwendungsbereich

Das Verfahren kann für ein Screening eingesetzt werden, ebenso zur Untersuchung theoretischer Fragen in nicht-klinischen und klinischen Stichproben.

 

 

3 Theoretischer Hintergrund

 

Der Penn State Worry Questionnaire (PSWQ; Meyer et al. 1990) soll in Übereinstimmung mit dem "Diagnostic and Statistical Manual of the American Psychiatric Association" (DSM III; APA 1987) exzessives, unrealistisches Sorgen als zentrales kognitives Begleitsyndrom einer generalisierten Angststörung (GAD) erfassen. Im DSM IV (1994) wurde dieses diagnostische Kriterium so erweitert, dass exzessives Sorgen zusätzlich als unkontrollierbar erlebt werden muss. Entsprechend sollen die PSWQ Items auch diese Sorgenfacette operationalisieren.

Stöber (1995) entwickelte und prüfte erstmals eine deutsche Version des PSWQ. Wie das englische Original enthält sie elf Items, die eine Sorgentendenz ausdrücken und fünf Items, die diese negieren bzw. deren Kontrollierbarkeit erfragen.

Wie andere sozialwissenschaftliche Itembatterien (vgl. Tabelle 1) enthält der PSWQ also Aussagen zur Operationalisierung hypothetischer, nur indirekt beobachtbarer Personenmerkmale, die positiv oder negativ in Richtung auf ein Zielmerkmal formuliert bzw. gepolt sind. Zustimmende bzw. nicht zustimmende Antworten zu diesen auch als Pro- bzw. Kontra-Items bezeichneten Aussagen indizieren hohe Ausprägungen auf dem Zielmerkmal. Die Verwendung solcher balancierter Itembatterien soll unerwünschte Beeinflussungen des Antwortverhaltens durch Antworttendenzen verringern. Die Konstruktion des PSWQ folgt damit einer Praxis, die u. a. durch Erfahrungen mit den Instrumenten der Berkeley Gruppe zur Erfassung einer Autoritären Persönlichkeit (Adorno et al., 1950) initiiert wurde.

Positive bzw. negative Zusammenhänge zwischen der Beantwortung der Items der Instrumente der Berkeley Gruppe mit dem Alter, der Bildung und dem sozialen Status von Befragten wurden zunächst dahingehend interpretiert, dass niedrige Bildung, geringer sozialer Status und höheres Alter autoritäre, ethnozentrische und antisemitische Tendenzen fördern. Andere Autoren lehnten diese Erklärung mit dem Argument ab, dass solche Zusammenhänge auch dadurch zustande kommen könnten, dass in den genannten demographischen Subgruppen Tendenzen zu bejahendem oder sozial erwünschtem Antworten unterschiedlich stark ausgeprägt seien. Durch extreme und positiv in Richtung negativer, d.h. symptomatischer Konstruktausprägungen formulierter Aussagen, die für die Items der Instrumente der Berkeley Gruppe charakteristisch sind, würden diese intensiviert bzw. selektiv aktiviert (z.B. Jackson & Messik, 1957). Diese Vermutung führte zu dem Vorschlag, solchen unerwünschten Beeinflussungen des Antwortverhaltens durch den Einsatz einer möglichst ausgewogenen Anzahl positiver und negativer Aussagen zur Operationalisierung desselben Konstrukts entgegenzuwirken. Beispiele balancierter Varianten zu den Skalen der Berkeley Gruppe dokumentieren z.B. Robinson et al. (1991). Beispiele für die Anwendung dieses Konstruktionsprinzips in anderen sozialwissenschaftlichen Disziplinen liegen in Tabelle 1 vor.

 

Tabelle 1

Beispiele für balancierte Fragebatterien und ihre Items

Instrument

Pro-Items

Kontra-Items

Affektivität (PANAS)

 habe mich gefühlt…

Stolz

Beschämt

Selbstwert (SES)

(Rosenberg)

Alles in allem bin ich mit mir zufrieden

Alles in allem neige ich dazu, mich für einen Versager zu halten

Depression (SDS)

Ich habe das Gefühl, dass es für andere besser ist, wenn ich tot wäre.

Ich glaube, dass ich nützlich bin und dass man mich braucht.

Penn State Worry Question. (PSWQ)

Über irgendetwas mache ich mir immer Sorgen.

Ich mache mir nie über etwas Sorgen.

Einstellungen

zu Juden

Durch ihr Verhalten sind die Juden an ihren Verfolgungen nicht ganz unschuldig.

Die Verfolgung der Juden durch den Faschismus ist eine große Schuld.

 

In balancierten Itembatterien muss also entweder positiven oder negativen Aussagen zugestimmt werden, um eine starke Ausprägung des Zielmerkmals zu erhalten. Welche Aussagerichtung dieses operationalisiert, ist nicht nach objektivierbaren sprachlichen oder methodischen Kriterien bestimmbar, sondern hängt von der Untersuchungsfrage ab. Bei Konstrukten wie Affektivität oder Selbstachtung stimmt sie zwar mit der evaluativ-affektiven Bedeutung der Itemaussagen überein. In klinischen Studien und in der empirischen Sozialforschung interessiert aber häufig der negative Konstruktpol. Entsprechend erfordern die Pro-Items negative Selbst-, Fremd- oder Objektbeurteilungen. Ein Beispiel ist der PSWQ, der über die Häufigkeit der Bejahung klinisch auffälliger Symptome Probanden mit einer pathologischen Sorgentendenz identifizieren soll.

In Abhängigkeit davon, welchen Populationen balancierte Instrumente vorgegeben werden, können sowohl Pro- als auch Kontra-Items nach der klassischen Testtheorie (KTT; zsf. z.B. Lord & Novick, 1968) oder der Item Response Theorie (IRT; zsf. Bartholomew & Knott, 1999; van der Linden & Hambleton, 1996; Lord & Novick, 1968; Rost, 2004) die "schwierigeren" Items sein, d.h. die Items, denen nur mit geringer Wahrscheinlichkeit zugestimmt wird. Je seltener bzw. weniger ausgeprägt das Zielmerkmal in einer Population ist, wie z.B. Depressivität in einer Studentenpopulation, umso schwieriger werden die Pro-Items im Vergleich zu den Kontra-Items sein. Würden dieselben Items z.B. depressiven Patienten vorgelegt, so wären die Kontra-Items schwieriger als die Pro-Items.

Kontra-Items werden zudem sprachlich sehr unterschiedlich generiert (vgl. Tabelle 1). Syntaktische Verneinungen von Pro-Items werden kaum verwendet: Die damit verbundene wörtliche Wiederholung von Iteminhalten irritiert Befragte und kann dadurch die Qualität der Itembeantwortung insgesamt gefährden (zsf. Barnette, 2000). Nur selten sind daher als Oppositionen eingesetzte Items lediglich syntaktische Varianten semantisch äquivalenter Aussagen.

Aufgrund dieser Besonderheiten sollte es nicht überraschen, dass die psychometrische Prüfung der Dimensionalität balancierter Instrumente oft eine zweifaktorielle Strukturierung der Antworten nahelegt, nach der die Antworten zu den Pro- und Kontra-Items jeweils durch einen gesonderten Faktor determiniert werden. Die Beobachtung des zweiten Kontra-(Item)Faktors ist jedoch in der Regel theoretisch unerwartet und wird, je nach Bereich und Itembatterie, sehr unterschiedlich erklärt. Nach einer Position repräsentiert er eine weitere Facette des zu operationalisierenden Konstrukts. Beispiele sind Interpretationen der zweifaktoriellen Struktur als positive vs. negative Affektivität (zsf. Schimmack et al., 2002) oder positives vs. transientes negatives Selbstwertgefühl (zsf. Tomás & Oliver, 1999). Nach einer dazu kontroversen Position reflektiert der Kontra-Faktor demgegenüber nur Methodenvarianz (zsf. Marsh, 1996; Tomás & Oliver, 1999; Brown, 2003), die durch die unterschiedliche Polung der Itemaussagen verursacht wird, eventuell in Interaktion mit weiteren Itemmerkmalen. Der zweite Faktor, der deshalb auch als Polungs(keying)-Faktor bezeichnet wird, ist danach also lediglich ein inhaltlich irrelevantes Methodenartefakt, dessen Zustandekommen, wenn überhaupt, sehr unterschiedlich erklärt wird.

Dies trifft auch auf den PSWQ zu. Seine Dimensionalität wurde zunächst mit traditionellen explorativen Hauptkomponenten- und Faktorenanalysen (PCA und FA; u.a. Brown et al., 1992; Stöber, 1995; van Rijsoort et al., 1999; Fresco et al., 2002a) zu ermitteln versucht. In neueren Arbeiten wurden dann statt dieser konfirmatorische FA-Modelle (CFA; Fresco et al., 2002b, Brown, 2003, Hazlett-Stevens et al., 2004) aus der Strukturgleichungsmodellierung (SEM; zsf. Bollen, 1989) eingesetzt. Sie sind nicht nur aus mehreren allgemeinen Gründen  traditionellen PCA´s und FA´s vorzuziehen, sondern erlauben es auch, die im vorliegenden Kontext strittige Frage direkt modellbasiert zu prüfen, inwieweit Kontra-Item Faktoren nur Methodenartefakte oder aber Konstrukteinflüsse widerspiegeln.

Alle zitierten Studien zum PSWQ (zsf. Glöckner-Rist & Rist, 2006) identifizierten für diesen die für viele balancierte Instrumente charakteristische zwei- statt der erwarteten einfaktoriellen Struktur. Wie bei anderen Instrumenten wird der Kontra-Faktor des PSWQ jedoch entweder als lediglich Methodenvarianz aufklärend interpretiert, die durch die Polung der Kontra-Items induziert wird (Brown, 2003; Brown et al., 1992; Stöber, 1995; van Rijsoort et al., 1999) oder inhaltlich als "fehlendes Sorgen" (Fresco et al., 2002a, b; Hazlett-Stevens et al., 2004). Aufgrund hier berichteter eigener Analysen präferieren wir in Übereinstimmung mit den zuletzt genannten Autoren eine inhaltliche Interpretation des Kontra-Faktors. Sie wird auch durch bereits vorliegende Ergebnisse (zsf. Glöckner-Rist & Rist, 2006) nahegelegt, u.a. durch substantielle Korrelationen, die Stöber (1995) und van Rijsoort et al. (1999) zwischen den PSWQ Antworten und der Beantwortung des Worry Domain Questionnaire (WDQ; deutsche Version: Stöber, 1995) beobachteten. Im Unterschied zum PSWQ soll der WDQ nicht pathologisches, sondern normales, d.h. begründetes und kontrollierbares Sorgen aufzeigen (vgl. van Rijsoort et al., 1999). Nach ihren Aussageinhalten indizieren die Kontra-Items u.E. jedoch nicht "fehlendes" sondern "normales" im Unterschied zu "pathologischem" Sorgen und sprechen damit auch das zweite, und nicht nur das erste der oben aufgeführten Merkmale für mit GAD assoziierte Sorgentendenzen nach dem DSM an.

Wegen der skizzierten inkonsistenten und uneindeutigen Ergebnisse wurde von uns die Dimensionalität des PSWQ erneut geprüft. Ziel war es dabei auch, einen allgemeinen Beitrag zur Prüfung alternativer Erklärungen von Polungs-Faktoren zu leisten: Der PSWQ eignet sich dazu, da er mehrere Konstruktionsmängel hat, aufgrund derer mögliche Einflüsse zusätzlicher Faktoren auf die Beantwortung seiner Kontra-Items nicht auszuschließen sind:

a)     Die Anzahl der Kontra-Items ist wesentlich geringer als die der Pro-Items.

b)     Insbesondere die Kontra-Items weisen Formulierungsschwächen auf, die spezifische Antworteffekte aufgrund erschwerter Antwortprozesse wahrscheinlich machen: Item 1 enthält z.B. eine doppelte Negation, Item 8 ist ambig in Bezug auf sich Sorgen formuliert und Item 10 ist wegen einer Konfundierung von Intensitäts- und Häufigkeitserfragung so extrem formuliert, dass es kaum bejahbar ist.

c)     Das 5-stufige Antwortformat "überhaupt nicht", "nur wenig", "ziemlich", "sehr" und "äußerst typisch für mich" enthält drei Optionen für zustimmende, aber nur zwei für nicht zustimmende Selbststereotypisierungen. Eine Option für neutrale bzw. moderate Selbstbeurteilungen fehlt.

Ein wichtiges Merkmal des PSWQ ist zudem, dass Antwortsets speziell die Antworten zu den Kontra-Items beeinflussen könnten.

 

 

4 Skalenentwicklung

 

Itemkonstruktion und Itemselektion

Der PSWQ-d (Stöber, 1995) enthält wie das englische Original (Meyer et al., 1990) elf Items, die eine Sorgentendenz ausdrücken und fünf Items, die diese negieren bzw. deren Kontrollierbarkeit erfragen. Der PSWQ umfasst somit Aussagen, die positiv und negativ in Richtung auf das zu erfassende Zielmerkmal einer pathologischen Sorgentendenz formuliert bzw. gepolt sind. Zustimmende bzw. nicht zustimmende Antworten zu diesen auch als Pro- und Kontra-Items bezeichneten Aussagen indizieren hohe Ausprägungen auf dem Zielmerkmal.

Der PSWQ wurde in einer Reihe von Studien in verschiedenen Ländern (zsf. Glöckner-Rist & Rist, 2006) zur Untersuchung pathologischer Sorgentendenzen eingesetzt. Nach wie vor besteht jedoch Unklarheit darüber, wie eine übereinstimmend in diesen Studien beobachtete zwei-faktorielle Strukturierung in einen Pro- und Kontra-(Item)Faktor zu interpretieren ist. Einige Autoren (Fresco et al., 2002a, b; Hazlett-Stevens et al., 2004) führen diese auf die Wirksamkeit von zwei Facetten eines Sorgenkonstrukts zurück. Andere kommen zu dem Schluss, dass die Grundstruktur des PSWQ, wie theoretisch gefordert, eindimensional sei. Die davon abweichende zweidimensionale Strukturierung sei nur durch Methodeneffekte verursacht, die durch die negativen Itemformulierungen induziert würden (Brown, 2003; Brown et al., 1992; Stöber, 1995; van Rijsoort et al., 1999).

Tatsächlich hat der PSWQ einige grundlegende Konstruktionsmängel, aufgrund derer eine Beeinflussung seiner Beantwortung durch zusätzliche, konstruktunabhängige Faktoren nicht auszuschließen ist, einschließlich inhaltsabhängiger und unabhängiger Antworttendenzen. Deshalb prüften wir die Dimensionalität des PSWQ-d erneut. Im Unterschied zu vorangehenden Arbeiten wurden entsprechende Analysen jedoch hypothesengeleitet mit aufeinander aufbauenden Messmodellen durchgeführt sowie mit Strukturmodellen, um weiterführend auch die Validität der Dimensionen des Instruments analysieren zu können.

 

Stichproben

Analysiert wurden die Daten von 794 Studierenden der Universität Münster. Nach Ausschluss unvollständig oder von anderen als Studierenden ausgefüllten Fragebogen wurden die von 731 Befragten in die Auswertungen einbezogen. 67.2% der Befragten waren weiblich. Das Durchschnittsalter betrug 20.6 Jahre.

Durchführung: Die Erhebung wurde an fünf Tagen im September 2004 im Schloss der Westfälischen Wilhelms-Universität Münster während der Einschreibungen zu verschiedenen Studiengängen durchgeführt. Der PSWQ-d wurde dabei gemeinsam mit einer Reihe weiterer Fragebogen zu dem allgemeinen Thema "Umweltbelastungen und Wohlbefinden" vorgegeben.

Die formale Genehmigung und Planung sowie die Vorbereitung der an die räumlichen Gegebenheiten angepassten Untersuchungsdurchführung (Aufbau eines Tisches, an dem eine Versuchsleiterin die ausgefüllten Fragebögen in Empfang nahm und auf dem Süßigkeiten für die Versuchsteilnehmer bereitstanden) erfolgten in Absprache mit dem Leiter des Studierendensekretariats der Westfälischen Wilhelms-Universität Münster.

Die Versuchsleiterinnen fragten Personen, die zur Einschreibung kamen, ob sie bereit wären, an einer Untersuchung zum oben genannten Thema teilzunehmen. Allen Angesprochenen wurde erklärt, dass es sich nicht um eine mit der Einschreibung zusammenhängende Befragung handele und dass die Teilnahme freiwillig sei. Die Wahrung der Anonymität wurde zugesichert. 78% aller so angesprochenen Personen beteiligten sich an der Befragung. Ca. 85% von ihnen waren Studierende. Nur deren Daten wurden in den Auswertungen berücksichtigt.

Die Mehrzahl der Angesprochenen, die eine Teilnahme ablehnten, begründete dies mit noch für die Einschreibung zu erledigenden Formalitäten und der damit einhergehenden Nervosität.

 

Variablen und Auswertungsmethode

a)     Aufbereitung der Daten: Fehlende Werte wurden über eine "Zwei-Weg" Imputation mit einem Programm von van Ginkel und van der Ark (2005)http://spitswww.uvt.nl/~avdrark/research/apm2005.pdf) ersetzt. Bei der Schätzung eines fehlenden Werts für ein Item aus einer homogenen (Sub-)Itembatterie berücksichtigt es simultan 1. wie entsprechende Items im Mittel von allen anderen Befragten mit gültigen Antworten beantwortet werden und 2. wie die Person, deren fehlender Wert zu ersetzen ist, alle anderen Items beantwortet hat. Alle Analysen erfolgten mit nicht rekodierten Kontra-Items.

b)     Analyseverfahren: Alle explorativen und konfirmatorischen Prüfungen der Dimensionalität des PSWQ erfolgten bisher mit faktoren- bzw. regressionsanalytischen Verfahren für kontinuierlich verteilte und linear mit ihren Konstrukten kombinierte manifeste Indikatoren. Bereits eine dafür erforderliche Intervallskalierung der PSWQ-Antworten ist aber unwahrscheinlich: a) Drei Optionen der 5-stufigen Antwortskala erlauben zustimmende Antworten, aber nur zwei ablehnende. b) Eine Option für mittlere bzw. neutrale Urteile fehlt. c) Wie für nicht klinische Stichproben zu erwarten, sind die Antworten zu allen Kontra- und den meisten Pro-Items schief verteilt. Dies gilt insbesondere für die beiden extrem formulierten Items 10 (Ich mache mir nie über etwas Sorgen) und 15 (Ich mache mir die ganze Zeit über Sorgen). Sie werden von 86% bzw. 80% der Befragten als überhaupt nicht bzw. als nur wenig typisch für sich selbst beurteilt. Aber auch bei den restlichen Items wird die Option "äußerst typisch für mich" durchwegs von weniger als 10% der Befragten gewählt. Alle hier berichteten Analysen erfolgten deshalb unter Rückgriff auf Mplus 3.2 (Muthén & Muthén, 2005) mit konfirmatorischen Mess- und Strukturmodellen für nicht kontinuierlich verteilte manifeste Indikatoren. Mplus analysiert dafür tetrachorische Korrelationen mit 2 Parameter IRT Normalogiven Modellen (zsf. Glöckner-Rist & Hoijtink, 2003).

c)     Beurteilungen der Modellgüte: Berichtet werden nur Ergebnisse, die mit einem robusten, mittelwerts- und varianzadjustierten WLS Schätzer (WLSMV) ermittelt wurden. Mplus setzt diesen automatisch in Analysen nicht normalverteilter Daten ein. Im Vergleich zum traditionellen WLS Schätzer führt er bei Stichprobenumfängen wie der unsrigen i.d.R. zu stabileren und weniger inflationierten Parameterschätzungen (vgl. z.B. Flora & Curran, 2004). Für eine statistische Beurteilung der Modellanpassung werden wie üblich χ²-Werte berichtet, obwohl sie mit zunehmenden Stichprobenumfängen wegen ihrer Teststärke zu häufig eine Ablehnung der Nullhypothese und damit des Modells nahelegen (zsf. Bollen, 1989). Mplus ermöglicht χ² - Differenzentests auch für mit WLSMV geschätzte, hierarchisch genestete Modelle. Sie berücksichtigen korrigierend, dass die Prüfgrößen für so geschätzte Modelle nicht χ²-verteilt sind. Allen Aussagen über signifikant unterschiedliche Anpassungen verschiedener Modelle liegen entsprechende Prüfungen zugrunde. Als deskriptive Anpassungsmaße berechnet Mplus den Comparative Fit Index (CFI), den Tucker Lewis Index (TLI) und den Root Mean Square Error of Approximation (RMSEA). CFI- und TLI-Werte < .90 und RMSEA-Werte .10 weisen auf eine unzureichende Modellanpassung hin, CFI- und TLI-Werte >.95 und RMSEA-Werte nahe .05 auf eine gute und CFI- und TLI-Werte zwischen .90 und .95 sowie RMSEA-Werte zwischen .09 und .06 auf eine akzeptable (zsf. Bollen, 1989). Zur Identifizierung der Modelle wurden die Varianzen der latenten Konstrukte bzw. Faktoren standardisiert.

d)     Messmodellprüfungen: Tomás und Oliver (1999) stellten verschiedene Messmodelle zusammen, die in der Literatur zur Prüfung alternativer Interpretationen von Kontra-Faktoren vorgeschlagen wurden. Wir haben sie auf die Analyse unserer PSWQ-d Daten übertragen, um folgende alternative Hypothesen über ihre dimensionale Struktur zu prüfen: Ein erstes Modell (vgl. Abbildung 1: Ia) formalisiert die Hypothese, dass die Kovarianzen der Antworten zum PSWQ durch nur einen bipolaren Sorgenfaktor gestiftet werden. Ein zweites Modell (vgl. Abbildung 1: Ib) repräsentiert die alternative Hypothese ihrer Verursachung durch zwei korrelierte Merkmalsfaktoren, die pathologisches vs. normales Sorgen reflektieren.

 

Abbildung 1. Messmodelle ohne Methodenfaktoren: 1a = ein bipolarer Sorgenfaktor, 1b = zwei korrelierte Sorgenfaktoren

 

Drei weitere Modelle (vgl. Abbildung 2) postulieren demgegenüber, dass die Antwortkovarianzen jeweils durch eine bipolare Sorgendimension generiert werden und durch mit dieser nicht korrelierte Kontra- (Modell IIa), Pro- (Modell IIb) oder Kontra- und Pro-Methodenfaktoren (Modell IIc).

 

 

 

Abbildung 2. Messmodelle mit Methodenfaktoren: IIa = ein bipolarer Sorgenfaktor/1 Kontra-Methodenfaktor, IIb = ein bipolarer Sorgenfaktor/1 Pro-Methodenfaktor, IIc = ein bipolarer Sorgenfaktor/1 Pro- und 1 Kontra-Methodenfaktor

 

Solche Modelle werden auch als Correlated Traits Correlated Methods (CTCM) Modelle bezeichnet. Ihre zentrale Annahme ist, dass sich die beobachtete Variation im Antwortverhalten aus Effekten von Personenmerkmalen, Methoden und unsystematischen "Messfehlern" bzw. itemspezifischen Restvarianzen linear zusammensetzt.

In einem ersten Analyseschritt wurden die Messmodelle I und II analysiert. Wegen der häufig beobachteten geschlechterrollenspezifischen Ausprägungen von Sorgentendenzen sowie von Metakognitionen über Sorgen (zsf. z.B. Francis et al., 2000) wurde das Geschlecht als Kovariate bereits in die Messmodellprüfungen einbezogen.

Validitätsprüfungen: In einem zweiten Schritt wurden die Messmodelle I und II gemeinsam mit denen für andere Konstrukte in erweiterte Mess- bzw. Strukturmodelle (S1, S2) integriert, um die inhaltliche Bedeutung der Faktoren durch eine Prüfung ihrer konvergenten und diskriminanten Validität bestimmen zu können, die durch die verschiedenen Messmodelle unterschiedlich definiert werden.

Die Studie, aus der die hier analysierten Daten stammen, diente nicht der psychometrischen Prüfung des PSWQ, sondern anderer Instrumente. Deshalb wurde kein für eine Validierung des PSWQ besonders geeignetes Maß für Angst mit erhoben. Zu erwarten ist aber, dass Krankheitsängste, Depressivität sowie Intoleranz gegenüber unsicheren und emotional erregenden Ereignissen und Situationen mit Sorgentendenzen einhergehen (z.B. van Rijsoort et al., 1999; Ladouceur et al., 1997; Freeston et al., 1994). Diese Konstrukte waren in der Befragung mit deutschen Versionen des Whiteley Index (WI; Hiller & Rief, 2004), des Patient Health Questionnaire (PHQ; Lwe et al., 2002) und der Intolerance of Uncertainty Scale (IUE; Hock & Krohne, 1992) ebenfalls erfasst worden und wurden deshalb in das Validierungsmodell aufgenommen. Das Geschlecht wurde als Kovariate einbezogen.

 

Itemanalysen

Nach einem χ²-Differenzentest (vgl. Tabelle 2) passt ein Modell mit zwei korrelierten Sorgendimensionen vgl. Abbildung 3besser zu den Daten als ein Modell mit nur einem bipolaren Merkmalsfaktorvgl. Abbildung 4.

 

Tabelle 2

Anpassungswerte für konfirmatorische Messmodelle (2 Parameter Normalogiven IRT Modelle/WLSMV-Schätzung) zur Formalisierung alternativer Interpretationen eines Kontra-Merkmalsfaktors für den PSWQ-d

 

Modell

Spezifikation

χ²*

df

CFI

TLI

RMSEA

Modelle ohne Methodenfaktoren

Ia

1 Merkmalsfaktor

563.5

68

.91

.97

.10

Ia1

Ia + 7 Residuenkorrelationen

433.3

65

.93

.98

.09

1a2

Ia1 + Geschl.

414.0

66

.93

.97

.09

Ib

2 Merkmalsfaktoren

350.1

69

.95

.99

.08

Ib1

Ib + 7 Resi.

218.7

65

.97

.99

.06

Ib2

Ib1 + 8 /10 zweidimensional

209.5

64

.97

.99

.06

Ib3

Ib2 + Geschlecht

201.9

64

.97

.99

.05

Ic

3 Merkmalsfaktoren

262.5

68

.96

.99

.06

Ic1

Ic + 3 Residuenkorrelationen

209.1

66

.97

.99

.05

Ic2

c1 + 2 Resi. + 8/10 zweidimensional

199.7

66

.97

.99

.05

Ic3

Ic2 + Geschlecht

194.4

66

.98

.99

.05

Modelle mit Methodenfaktoren

IIa

1 Merkmals/1 Kontra-Methodenf.

349.

70

.95

.99

.07

IIa1

IIa + Residuenkorrelationen

220.4

65

.97

.99

.06

IIa2

IIa1 + Geschlecht

213.0

65

.97

.99

.06

IIb

1 Merkmals-/1 Pro-Methodenfaktor

375.

65

.94

.98

.08

IIb1

IIb + 7 Resi.

220.9

59

.97

.99

.06

IIb2

IIb1 + Geschlecht

215.7

59

.97

.99

.06

IIc

1 Merkmals- /2 Pro- und Kontra- Methodenfaktoren

331.

69

.95

.99

.07

IId .05

1 bipolarer F. /3 Pro- und Kontra-Item Faktoren + 2 Residuen

157.5

61

.98

.99

.05

2d1

IId + Geschlecht

154.0

61

.98

.99

.05

Anmerkung. * Alle χ²-Werte sind signifikant: χ² = χ²-Testwert, df = Freiheitsgrade, CFI = Comparative Fit Index, TLI = Tucker Lewis Index, RMSEA = Root Mean Square Error of Approximation

 

Zur schlechten Passung von Modell Ia trägt bei, dass sich nur die Kontra-Items 8 und 10 in eine eindimensionale bipolare Struktur einfügen. Auffällig ist darüber hinaus die große Zahl signifikanter Residuenkorrelationen, sowie a) dass die Residuen von Kontra- und Pro-Items miteinander nur bivariat und deutlich seltener und schwächer korrelieren als untereinander, b) dass zu den Items mit den höchsten Korrelationen zwar alle Kontra-, aber auch mehrere Pro-Items gehören und c) dass die Residuen der meisten der daran beteiligten Items mit den Residuen von mehreren anderen Items assoziiert sind.

Nach Modell Ia (vgl. Abbildung 4) haben die Kontra-Items 8 und 10 eine engere Beziehung zu den Pro-Items als die übrigen Kontra-Items. Das positiv formulierte Item 8 "Mir fällt es leicht, sorgenvolle Gedanken zu vertreiben" verneint aber auch nicht wie die übrigen Kontra-Items, sich zu sorgen. Es setzt vielmehr implizit voraus, dass dies zumindest manchmal der Fall ist. Das sehr extreme und entsprechend stark linksschief verteilte Item 10 "Ich mache mir nie über etwas Sorgen" negiert lexikalisch die Pro-Items 7 "über irgend etwas mache ich mir immer Sorgen" und 15 "Ich mache mir die ganze Zeit über Sorgen". Die Residueninterkorrelationen der Pro-Items 14, 15, 9 und 7 sind signifikant und auch dem Betrag nach hoch. Brown (2003) beobachtete ähnliche Residuenkorrelationen, deren freie Schätzung die Modellanpassung verbesserte. Diese Items, die im Unterschied zu den übrigen Pro-Items die Exzessivität und damit eine pathologische Dimension von Sorgenprozessen ansprechen, teilten auch nach Hazlett-Stevens et al. (2004) spezifische Varianz. Das Residuum von Item 9 ist zudem wie bei Brown noch mit dem von Pro-Item 16 assoziiert, das wie Item 9 zusätzlich Perfektionismus thematisiert und damit ein Persönlichkeitsmerkmal, das mit Sorgentendenzen einhergeht (zsf. Pratt et al., 1997). Die Residuen der Kontra-Items 8 und 10 korrelieren ebenfalls bedeutsam. Naheliegend ist, dass beide Items bejaht werden, wenn eine Selbstwahrnehmung als sorgenfrei daraus resultiert, dass sorgenvolle Gedanken als leicht kontrollierbar erlebt werden.

Die freie Schätzung dieser Residuenzusammenhänge und die damit einhergehende nur noch partiell vorausgesetzte lokale stochastische Unabhängigkeit der Itemantworten verbessert die Anpassung von Modell Ia zwar signifikant (vgl. Tabelle 2). Sie ist aber immer noch nicht gut. Zudem sind die Kontra-Item- Faktor Assoziationen (-.36 (1), -.29 (3), -.53 (8), -.66 (10), -.32 (11)) dann schwächer. Das gilt auch, wenn zusätzlich das Geschlecht (1 = weiblich, 2 = männlich) als Kovariate einbezogen wird (vgl. Tabelle 2). Es beeinflusst direkt, und nicht nur vermittelt über die Faktoren, die Beantwortung aller Pro-Items signifikant negativ (-.15 bis -.31) und die aller Kontra-Items positiv (.15 bis .31).

Diese Befunde sprechen dagegen, dass die Beantwortung des PSWQ durch nur eine bipolare Konstruktdimension beeinflusst wird. Aber auch Modell Ib erklärt die Antwortzusammenhänge noch nicht zufriedenstellend (vgl. Tabelle 2). Durch Zulassen a) derselben Residuenkorrelationen wie für Modell Ia sowie b) zusätzlicher Assoziationen der Items 8 (-. 27) und 10 (-.29) mit dem Pro-Item Faktor (Modell 1b2), die Modell Ia nahelegt, verbessert sich die Passung von Modell Ia zwar jeweils signifikant (vgl. Tabelle 2). Dies wirkt sich jedoch nur minimal (+ .05) auf die Faktor-Indikator Assoziationen (vgl. Abbildung 3) aus.

 

Abbildung 3. PSWQ-d Messmodelle ohne Methodenfaktoren: Ib = zwei korrelierte Sorgenfaktoren

 

Die nach Modell Ib2 zweidimensionalen Items 8 (.41) und 10 (.65) sind dann zudem, wie zu erwarten, schwächer mit dem Kontra-Faktor assoziiert. Beide so modifizierten Modelle legen aber höhere Korrelationen der eindimensionalen Kontra-Items mit ihrem Faktor nahe (.52 (1), .44 (3), .47 (11)) als das restringiertere Modell Ib. Die Korrelation des Pro- und Kontra-Faktors sinkt auf -.63.

Die Faktorladungen für die Items nach konfirmatorischen Messmodellen mit nur einem bipolaren Sorgenfaktor sind in Abbildung 4 dargestellt.

 

 

 

Abbildung 4. PSWQ-d Messmodelle ohne Methodenfaktoren: Ia = ein bipolarer Sorgenfaktor

 

Bei Auspartialisierung von Geschlechtereffekten auf die Antworten zu allen Items (vgl. Tabelle 2) sinken die χ²- und RMSEA-Werte erneut. Die Bedeutsamkeit dieser Verringerungen kann jedoch nicht statistisch geprüft werden, da Modell Ib3 nicht hierarchisch mit den anderen Modellen verbunden ist. Alle Faktor-Indikator Assoziationen sind nach diesem Modell etwas schwächer als nach den anderen Modellen, die Faktorinterkorrelation sinkt auf -.58.

Signifikante Residuenkorrelationen der Items 7, 9, 14 und 15 weisen erneut darauf hin, dass ihre Beantwortung eventuell durch eine weitere, für sie spezifische Varianzquelle systematisch mit beeinflusst wird. Ein deshalb mit zwei statt einem Pro- sowie einem Kontra-Sorgenfaktor spezifiziertes Modell Ic (vgl. Abbildung 5) führt zu einer akzeptablen Faktorenstuktur, die bessere Anpassungswerte (vgl. Tabelle 2) als alle Modelle Ib erzielt. Analoge Aufhebungen von Restriktionen wie für die Modelle Ia und Ib  führen zu einer guten Modellanpassung nach allen deskriptiven Anpassungsmaßen.

 

 

Abbildung 5. PSWQ-d Messmodelle ohne Methodenfaktoren: Ic = drei korrelierte Sorgenfaktoren

 

b) Ein bipolarer Sorgenfaktor und ein positiver oder negativer Methodenfaktor?

Die zur Beantwortung dieser Frage durchgeführten Analysen zeigen: Die Modelle, die die Hypothese von jeweils einem bipolaren Sorgenfaktor und von einem mit diesem unkorrelierten Kontra- (vgl. Abbildung 6), Pro- (vgl. Abbildung 7) sowie Kontra- und Pro-Methodenfaktor (vgl. Abbildung 8) formalisieren, erzielen zunehmend bessere Anpassungswerte (vgl. Tabelle 2). Einschränkend ist jedoch zu berücksichtigen, dass sie auch zunehmend mehr Residuenvarianz aufklären. Varianten dieser Modelle, die jeweils gleich starke Beziehungen von Items mit einem Methodenfaktor postulieren, sind zudem deutlich weniger akzeptabel als Modelle ohne diese Restriktion.

Methodeneffekte sollten per definitionem unabhängig von dem Inhalt einzelner Itemaussagen auftreten. Für die Modelle II mit unipolaren Pro- und Kontra-Methodenfaktoren wurden deshalb zunächst jeweils zwei hierarchisch genestete Varianten gegeneinander getestet, in denen die unstandardisierten Faktor-Indikator Assoziationen entweder als frei variierend oder als vergleichbar stark spezifiziert wurden. Akzeptable, aber nach χ²-Differenzentests nicht signifikant unterschiedliche Anpassungen dieser Modelle, wären ein deutlicher Hinweis darauf, dass die Antworten zu den Pro- bzw. Kontra-Items durch Methodeneffekte oder asymmetrische, inhaltsunabhängige Antwortstile mit beeinflusst wurden. Diese Beobachtungen und die folgenden sprechen dagegen, dass der jeweils zweite oder dritte Faktor nur durch syntaktische Aussagenmerkmale hervorgerufene, inhaltsunabhängige Methoden- oder Antwortstileffekte reflektiert:

 

Abbildung 6. PSWQ-d Messmodelle mit Methodenfaktoren: IIa = ein bipolarer Sorgenfaktor/1 Kontra-Methodenfaktor

 

 

Abbildung 7. PSWQ-d Messmodelle mit Methodenfaktoren: IIb = ein bipolarer Sorgenfaktor/ein Pro-Methodenfaktor

 

 

Abbildung 8. PSWQ-d Messmodelle mit Methodenfaktoren: IIc = ein bipolarer Sorgenfaktor/ein Pro- und ein Kontra-Methodenfaktor

 

Ein Kontra-Methodenfaktor (Modelle IIa): Nach Modell IIa beeinflusst zwar ein bipolarer Merkmalsfaktor die nach den Modellen I mehrdimensionalen Kontra-Items 8 und 10 stärker als ein unipolarer Kontra-Methodenfaktor (vgl. Abbildung 2). Das Umgekehrte gilt aber für die anderen Kontra-Items. Aufgrund einer freien Schätzung derselben Residuenkorrelationen wie in den Modellen II sinkt der χ²-Wert zwar deutlich, die Faktorenstruktur ändert sich jedoch kaum. Alle weniger restringierten Modelle II (vgl. Tabelle 2) erklären zudem nach den χ²-Werten die Daten schlechter als die analog weniger restriktiven Modelle 1b2 und 1b3.

Ein Pro-Item Methoden Faktor (Modelle IIb): Nach Modell IIb (vgl. Abbildung 7) beeinflusst zwar ein unipolarer Pro-Methodenfaktor anders als bei Hazlett-Stevens et al. (2004) die Antworten zu allen Pro-Items bedeutsam. Die vier Pro-Items 7, 9, 14 und 15, die spezifisch die Exzessivität/ Unkontrollierbarkeit von Sorgen ansprechen, sind jedoch stärker mit diesem als mit dem bipolaren 16-Item Faktor assoziiert, obwohl dieser die Antworten zu fast allen Kontra-Items stärker beeinflusst als dies Modell Ia nahelegt. Danach würde der unipolare Pro-Faktor aber nicht Methodenvarianz verursachen, sondern entspräche einer weiteren konstruktabhängigen Varianzquelle, die nur die Beantwortung eines Teils der Pro-Items zusätzlich systematisch beeinflusst. Erneut sinkt der χ²-Wert zwar deutlich, wenn dieselben Residuenkorrelationen wie in den Modellen I und in Modell IIa zugelassen werden und wiederum, wenn Geschlechtereffekte auspartialisiert werden. Die Faktorenstruktur ändert sich jedoch nur geringfügig. Die χ²-Werte dieser Modelle sind wie die der weniger restriktiven Modelle IIa höher als die der Modelle Ib2 und Ib3.

Ein bipolarer Faktor, zwei bzw. drei unipolare, nur untereinander korrelierte Pro- und Kontra-Faktoren (Modell IIc) sowie als weitere Modellvariante I drei unipolare Merkmalsfaktoren (Modell Ic):

Nach Modell IIc (vgl. Abbildung 8) mit einem statistisch signifikant geringeren χ²-Wert gegenüber den Modellen Ia, Ic sowie IIa und IIb, sind alle Kontra-Items zum Teil deutlich höher mit einem unipolaren Kontra- als mit einem bipolaren 16 Item-Faktor assoziiert. Die Items 7, 9, 14 und 15 korrelieren aber nur mit diesem signifikant und höher als nach Modell IIb (vgl. Abbildung 7). Der unipolare Pro-Methodenfaktor beeinflusst sie demgegenüber nicht statistisch bedeutsam. Mit Ausnahme von Item 6 sind auch die übrigen Pro-Items stärker mit dem bipolaren als mit dem unipolaren Faktor assoziiert. Die beiden unipolaren Faktoren korrelieren wie nach Modell Ib relativ hoch negativ. Diese Beobachtungen sprechen gegen eine Interpretation des Kontra-Faktors als Methodenfaktor und deuten erneut auf eine zusätzliche zweidimensionale Strukturierung der Pro-Itembeantwortungen hin. Deshalb wurde die Hypothese von drei korrelierten unipolaren Faktoren und einem mit ihnen nicht korrelierten bipolaren Faktor als weitere Variante der Modelle II geprüft. Dieses Modell IId erklärt die Daten am besten von allen geprüften Modellen, der Beitrag des bipolaren Faktors ist jedoch vernachlässigbar gering. Sowohl die Anpassung wie die Faktor-Item-Assoziationen sprechen dafür, dass hier erneut wie durch Modell Ic (vgl. Abbildung 5) drei inhaltlich interpretierbare Dimensionen von Sorgenprozessen identifiziert werden.

 

Itemkennwerte

Die Faktorladungen und damit aus diesen ableitbare Reliabilitätskoeffizienten (1 - Faktorladungen/Quadrat) für die Items nach konfirmatorischen Messmodellen mit nur einem bipolaren Sorgenfaktor (vgl. Abbildung 4), zwei korrelierte Merkmalsfaktoren (vgl. Abbildung 3) sowie jeweils einer bipolaren Sorgendimension und einem mit dieser nicht korrelierten Kontra- (vgl. Abbildung 6), Pro- (vgl. Abbildung 7) oder Kontra- und Pro-Methodenfaktor (vgl. Abbildung 8) liegen vor.

 

 

5 Gütekriterien

 

Reliabilität

Die Faktorladungen für die verschiedenen PSWQ-d Messmodelle können zur Abschätzung der Reliabilität herangezogen werden.

 

Validität

Zur Konstruktvalidierung wurden Zusammenhänge der PSWQ-d Beantwortungen mit deutschen Versionen des Whiteley Index (WI; Hiller & Rief, 2004), des Patient Health Questionnaire (PHQ; Lwe et al., 2002) und der Intolerance of Uncertainty Scale (IUE; Hock & Krohne, 1992) geprüft. Vorab wurde explorativ und konfirmatorisch für den WI eine dreidimensionale Strukturierung in Symptombelastung, Krankheitsangst und Krankheitsüberzeugungen ermittelt, für den IUE eine in Intoleranz gegenüber Unsicherheit von belastenden Situationen/Ereignissen, dadurch ausgelöster emotionaler Erregung sowie gegenüber Kosten und Aufwand ihrer Bewältigung. Für den PHQ wurde eine zweidimensionale Strukturierung in depressive Verstimmung und depressive Symptome identifiziert. Das Geschlecht wurde als Kovariate einbezogen.

Nach χ²-Differenzentests sind die Daten am schlechtestenName=t4; HotwordStyle=BookDefault; fundort=d133;  mit einem Strukturmodell (S1a) vereinbar (vgl. Tabelle 3), das die Hypothese nur eines bipolaren Sorgenfaktors formalisiert. Am besten schneidet demgegenüber ein Modell (S1c) ab, das drei unipolare Sorgenfacetten hypostasiert.

 

Tabelle 3

Anpassungswerte für konfirmatorische Validierungsmodelle (2 Parameter Normalogiven IRT Modelle/WLSMV-Schätzung)

 

x2*

df

CFI

TLI

RMSEA

Modelle ohne Methodenfaktoren

S1a: 1 Merkmalsf. + Residuen   

807.2

315

.92

.97

.05

S1b: 2 Merkmalsf. + Residuen + 8/10 mehrdim.

763.6

315

.93

.97

.04

S1c: 3 Merkmalsfaktoren Modelle mit Methodenfaktoren

742.4

315

.93

.97

.04

Modelle mit Methodenfaktoren

S2a: 1 Merkmals- / 1 Kontra Methodenf. + Residuen Pro-Items

766.0

315

.93

.97

.04

S2b: 1 Merkmalsf. / 1 Pro Methodenf. + Residuum 8/10

766.5

315

.93

.97

.04

S2c: 1 bipolarer F. / 2 Pro und Kontra-F. 

710.3

315

.94

.97

.04

Anmerkung. *: Alle x2-Werte sind signifikant; χ² = χ²--Testwert, df = Freiheitsgrade, CFI = Comparative Fit Index, TLI = Tucker Lewis Index, RMSEA = Root Mean Square Error of Approximation

 

Ein unipolarer Kontra-Methodenfaktor (Modell S2a) korreliert zudem erwartungsgemäß nicht bedeutsam mit den zur Validierung herangezogenen Konstruktdimensionen, abgesehen von einem Zusammenhang mit dem dritten IUE-Faktor (vgl. Tabelle 4). Dieser Faktor erfasst jedoch nicht Intoleranz von Angst oder emotionaler Erregung aufgrund beunruhigender Situationen, wie die beiden anderen IUE-Faktoren, sondern nur Intoleranz gegenüber der Bewältigung solcher Situationen.

 

Tabelle 4

Zusammenhänge zwischen den PSWQ Antworten und anderen Konstrukten

 

Whiteley-Index

PHQ

IUE

Modell 

SB

KS

DV

DS

IS

IE

IK

SIa:  bipolarer Merkmalsfaktor

.40

.43

.46

.47

.57

.51

.45

.30

SIb:  Kontra-Merkmalsfaktor  

-.29

-.35

-.27

-.20

-.26

-.31

-.25

-.02

         Pro-Merkmalsfaktor     

.40

.42

.46

.49

.58

.51

.45

.32

SIc:   Kontra-Merkmalsfaktor  

-.33

-.38

-.31

-.26

-.34

-.36

-.31

-.07

         Pro-Merkmalsfaktor+    

.35

.40

.42

.45

.53

.54

.48

.33

         Pro-Merkmalsfaktor*    

.44

.42

.49

.52

.61

.42

.35

.28

SIIa: Kontra-Methodenfaktor  

.06

.12

-.01

-.13

-.13

-.01

-.03

-.22

         bipolarer Faktor      

.40

.42

.46

.38

.58

.51

.45

.32

SIIb: Pro-Methodenfaktor     

-.12

-.04

.05

.12

.04

.48

.51

.46

         bipolarer Faktor      

.42

.44

.45

.46

.56

.44

.37

.22

SIIc:  Kontra-Methodenfaktor 

-.21

-.30

-.22

-.16

-.21

-.39

-.35

-.10

         Pro-Methodenfaktor     

.22

.30

.34

.37

.40

.63

.58

.42

         bipolarer Faktor      

.39

.31

.32

.33

.45

-.05

-.08

-.07

Anmerkung. SB=Symptombelastung, KS=Krankheitssorgen, KÜ=Krankheitsüberzeugungen, DV=depressive Verstimmung, DS=depressive Symptome, IS=Intoleranz unsichere Situationen, IE=Intoleranz emotionale Erregung, IK=Intoleranz Kosten; + = Items 2, 4, 5, 6, 12, 13 16;  * = Items 7, 9, 14 15

 

Ein Pro-Methodenfaktor (Modell S2b) ist zwar nicht mit hypochondrischen Tendenzen und Depressivität assoziiert, aber signifikant mit allen drei IUE-Dimensionen. Er hängt stärker mit dem dritten, und auch mit dem zweitem IUE-Faktor "Intoleranz gegenüber emotionaler Erregung" zusammen als der bipolare Faktor. Wird keine Orthogonalität unipolarer Pro- und Kontra-Faktoren erzwungen, sind diese nach allen entsprechenden Modellen (S1b, S1c und S2c) substantiell (> .55) untereinander assoziiert (vgl. Tabelle 4). Die Kontra-Faktoren sind dann mit allen Validierungskonstrukten negativ assoziiert, außer mit dem dritten, inhaltlich wenig bedeutsamen IUE Faktor, wenn auch durchgängig schwächer als die ein bzw. zwei Pro-Faktoren. Der dritte IUE Faktor ist mit diesen am schwächsten assoziiert. Pro-Items (Modell S1c), die spezifisch die für pathologisches Sorgen charakteristische Exzessivität bzw. Unkontrolliertheit referenzieren, korrelieren stärker mit hypochondrischen Tendenzen sowie depressiver Verstimmung und Symptomatik als jene Pro-Items, die vorrangig situationsbezogene Aspekte von sich Sorgen und Perfektionismus thematisieren. Das Umgekehrte gilt für die Zusammenhänge mit den drei IUE-Dimensionen. Die unipolaren Pro- und Kontra-Faktoren nach den Modellen S1b, S1c und S2c zeigen schließlich wie der bipolare Sorgenfaktor nach Modell 1a jeweils einen höheren Zusammenhang mit depressiven Symptomen als mit depressiver Verstimmung auf.

Nach diesen und den zur Dimensionalität berichteten Befunden beruht eine mehrdimensionale Strukturierung der Beantwortung des PSWQ also nicht lediglich auf einem statistischen oder methodischen Artefakt, das durch entgegengesetzte Itemaussagen hervorgerufen wird. Wir finden systematische Beziehungen der Beantwortungen der Kontra-Items zu Geschlecht und sorgenverwandten Konstrukten wie Depressivität, Krankheitsängsten und -sorgen sowie Intoleranz gegenüber Ereignis- und Handlungsunsicherheit. Zusammenhänge zwischen den Antworten zu den Kontra-Items werden also primär dadurch gestiftet, dass die Kontra- im Unterschied zu den Pro-Items spezifische Merkmale normaler Sorgenprozesse ansprechen, und nicht durch inhaltsunabhängige Aussagemerkmale oder Antwortstile. Auch die Beantwortung mehrerer Pro-Items unterliegt erkennbar zusätzlichen systematischen Einflüssen, wie Hazlett-Stevens et al. (2004) bereits vermuteten. Diese Pro-Items referenzieren ebenfalls spezifische Facetten einer Sorgentendenz, wie deren Exzessivität und Situationsunabhängigkeit. Wir fanden keine Evidenz dafür, dass sie Antwortstile oder andere konstruktirrelevante, theoretisch wenig plausible semantikunabhängige Verarbeitungsprozesse differentiell induzieren. Entsprechend enthielt unser am besten passendes Messmodell zwei unipolare Merkmalsfaktoren für die Pro-Items und einen unipolaren Merkmalsfaktor für die Kontra-Items.

Aufgrund der theoretisch unerwarteten Zweidimensionalität balancierter Fragebogen und der Schwierigkeit ihrer Interpretation, diskutieren einige Autoren (z.B. Hazlett-Stevens et al., 2004; Fresco et al., 2002b) die Aufgabe der Praxis des Ausbalancierens. Der Verzicht auf Kontra-Items wäre jedoch keine Lösung für die Vermeidung unerwünschter konstruktabhängiger oder unabhängiger Einflüsse auf das Antwortverhalten. Im Gegenteil, sie können wichtige und prüfbare Hinweise auf störende Einflüsse vorab nicht bedachter zusätzlicher Varianzquellen liefern. Zum Teil geringe Reliabilitäten und formale Validitäten auch für Pro-Items sowie schwache Zusammenhänge zwischen den Kontra-Items und verwandten Konstrukten legen jedoch nahe, dass der PSWQ Schwächen in den Item- und der Antwortskalaformulierung aufweist, die modifiziert werden sollten:

a) Formulierungsschwächen wie doppelte Verneinungen (Items 1, 5, 11), Aussageambiguitäten (Items 8, 5), extreme sowie Intensität und Häufigkeit konfundierende Aussagen (Items 8, 7, 15), mit denen besonders, aber nicht ausschließlich Kontra-Items behaftet sind, sollten behoben werden, um spezifische Antworteffekte aufgrund erschwerter Antwortprozesse zu minimieren.

b) Das Antwortformat sollte so balanciert werden, dass es vergleichbar viele zustimmende und zurückweisende Antwortoptionen enthält. Wenn die Konstruktion als Selbstbeurteilungsskala beibehalten wird, sollte nicht gefragt werden, wie typisch die durch die Items ausgedrückten Sachverhalte für Befragte sind, sondern nur, ob diese zutreffen oder nicht: Das derzeitige Antwortformat erfordert nicht nur Urteile über das Zutreffen vs. Nichtzutreffen von Sachverhalten wie z.B. "Viele Situationen machen mir Sorgen" (Item 4), sondern selbststereotypisierende Bewertungen, d.h. Urteile darüber, ob der Sachverhalt ein situationsüberdauerndes Selbstmerkmal ist. Dadurch kann zwar die Extremheit von Aussagen abgeschwächt werden wie z.B. von Items wie "Ich mache mir immer Sorgen" oder "ich mache mir nie Sorgen", da "typisch" in diesem Zusammenhang nur bedeutet, dass dies zwar i.d.R. der Fall ist, aber nicht notwendig immer. Die Bejahung z.B. von Item 4 kann dann aber nicht nur die Wahrnehmung der Befragten ausdrücken, dass sie sich vielen besorgniserregenden Situationen ausgesetzt sehen, d.h., dass sie sich external aufgrund häufiger realer Gegebenheiten sorgen. Bejaht werden könnte es vielmehr auch deshalb, weil Situationen aufgrund einer individuellen Tendenz dazu häufig als besorgniserregend interpretiert werden.

Schimmack et al. (2002) belegen zudem in Übereinstimmung mit anderen Studien (zsf. Schimmack et al., 2002), dass solche Antwortformate häufig bipolar interpretiert werden, und dass wegen des Fehlens einer entsprechenden Antwortoption neutrale bzw. mittlere Einstellungsurteile häufig durch Wahl der mittleren Antwortkategorie auszudrücken versucht werden. Auch kognitive Vortestungen von Einstellungsinstrumenten der Umfrageforschung decken ein solches Antwortverhalten immer wieder auf (z.B. Prüfer & Rexroth, 2004). Es ist also wahrscheinlich, dass in Richtung Sorgenkontrollierbarkeit formulierten Selbstaussagen auch nur deshalb zugestimmt wurde, um mittlere bzw. mäßige Ausprägungen von sich Sorgen auszudrücken.

Ein weiteres Problem ist die fehlende neutrale Antwortkategorie. Antwortformate wie die des PSWQ werden häufig bipolar interpretiert (Schimmack et al. (2002). Fehlen neutrale Antwortoptionen, versuchen Probanden häufig, diese durch die Wahl der mittleren Antwortkategorie auszudrücken. Auch kognitive Vortestungen von Einstellungsinstrumenten der Umfrageforschung decken ein solches Antwortverhalten immer wieder auf (z.B. Prüfer & Rexroth, 2004). Zustimmung zu den in Richtung Sorgenkontrollierbarkeit formulierten Selbstaussagen könnte also auch bedeuten, dass damit nur eine mittlere bzw. mäßige Ausprägung von sich Sorgen ausgedrückt werden sollte. Die Aufnahme einer neutralen Kategorie würde solche Interpretationsschwierigkeiten vermeiden.

c) Schließlich müsste die Anzahl der Kontra- und Pro-Items balanciert werden. Um eine Verlängerung des Instruments zu vermeiden, könnten dafür Pro-Items weggelassen oder entgegengesetzt formuliert werden.

Aufrufe zur Revision eines weit verbreiteten Instruments verhallen oft ungehört, denn die damit verbundenen Nachteile scheinen zunächst in keinem Verhältnis zu den erwarteten, aber erst noch zu realisierenden Vorteilen einer Revision zu stehen: Zukünftige Daten können mit den in zahlreichen anderen Studien schon erarbeiteten Befunden nicht mehr verglichen werden. Wenn aber wissenschaftliches Arbeiten als Weiterentwicklung nomothetischer Netzwerke verstanden wird, dann ist es unerlässlich, die Operationalisierungen von Konstrukten iterativ zu präzisieren, um im Gegenzug Wechselbeziehungen zwischen Konstrukten besser zu erfassen und theoretisch verständlich machen zu können. Zunächst eher freizügig formulierte Items von Instrumenten wie dem PSWQ daraufhin zu untersuchen, inwieweit sie eine solide und generalisierbare Erfassung eines Konstrukts gewährleisten, und sie gegebenenfalls zu revidieren, wenn dies fraglich ist, ist ein unumgänglicher Schritt in diesem Prozess.

 

Deskriptive Statistiken (Normierung)

Deskriptive Statistiken zur Beurteilung der Verteilung und der Leichtigkeit der Items liegen in Tabelle 5 vor.

Tabelle 5

Modalwerte (MO), Mediane (M) und Prozentsätze nicht zustimmender Antworten (%nZ; überhaupt nicht (1) + nur wenig (2) typisch für mich) für die PSWQ-d Items

Nr.

Item

MO

ME

%nZ

2

Meine Sorgen wachsen mir über den Kopf.

2

2

46.1

4

Viele Situationen machen mir Sorgen.

2

2

40.8

5

Ich weiß, ich sollte mir keine Sorgen machen, aber ich kann nichts dagegen machen.

2

3

28.7

6

Wenn ich unter Druck stehe, mache ich mir viel Sorgen.

3

3

25.9

12

Ich war schon immer jemand, der sich viel Sorgen macht.

2

2

36.9

13

Mir fällt auf, dass ich mir über einiges Sorgen gemacht habe.

3

3

25.2

16

Ich mache mir über Vorhaben so lange Sorgen, bis sie komplett erledigt sind.

3

2

34.1

7

Über irgendetwas mache ich mir immer Sorgen.

2

2

35.4

9

Sobald ich eine Aufgabe beendet habe, fange ich an, mir über all das Sorgen zu machen, was ich sonst noch tun muss.

2

2

43.6

14

Wenn ich erst einmal anfange, mir Sorgen zu machen, kann ich nicht mehr damit aufhören.

2

2

43.5

15

Ich mache mir die ganze Zeit über Sorgen.

2

1

36.0

1

Wenn ich nicht genug Zeit habe, alles zu erledigen, mache ich mir darüber keine Sorgen

2

2

43.0

3

Ich neige nicht dazu, mir über Dinge Sorgen zu machen.

2

2

33.7

8

Mir fällt es leicht, sorgenvolle Gedanken zu vertreiben.

2

2

43.5

10

Ich mache mir nie über etwas Sorgen.

1

1

25.7

11

Wenn ich in einer Angelegenheit nichts mehr tun kann, mache ich mir auch keine Sorgen mehr darüber.

2

2

40.9


 

6 Literatur und Datenquellen

 

Kontakt zu Autor(en)

-       Angelika Glöckner-Rist, Dipl. Psych., Dipl. Inf.-wiss., Dr., Email: angelika.gloeckner-rist@gesis.org; GESIS, B2,1, 68159 Mannheim.

-       Fred Rist, Dipl. Psych., Prof. Dr., Email: rist@uni-muenster.de; Wilhelms-Universität Münster, Psychologisches Institut I, Fliednerstr. 21, 48194 Münster.

 

Literaturverzeichnis

Adorno, T. W., Frenkel-Brunswik, E., Levinson, D. J., & Sanford, R. N. (1950). The authoritarian personality. New York: Harper and Row.

American Psychiatric Association (1987). Diagnostic and statistical manual of mental disorders (3rd ed. Rev.). Washington, DC: Author.

American Psychiatric Association (1994). Diagnostic and statistical manual of mental disorders (4th ed.). Washington, DC: Author.

Bagozzi, R. P. (1993). An examination of the psychometric properties of measures of negative affect in PANAS-X scales. Journal of Personality and Social Psychology, 50, 35-46.

Barnette, J. J. (2000). Effects of stem and Likert response option reversals on survey internal consistency: If you feel the need, there is a better alternative to using those negatively worded stems. Educational and Psychological Measurement, 60(3), 361-370.

Bollen, K. A. (1989). Structural equations with latent variables. New York: Wiley.

Brown, T. A. (2003). Confirmatory factor analysis of the Penn Worry Questionnaire: Multiple factors or method effects? Behaviour Research and Therapy, 41, 1411-1426.

Brown, T. A., Antony, M. M., & Barlow, D. H. (1992). Psychometric properties of the Penn State Worry Questionnaire in a clinical anxiety disorders sample. Behaviour Research and Therapy, 30, 33-37.

Byrne, B. M., & Goffin, R. D. (1993). Modeling MTMM data from additive and multiplicative covariance structures: An audit of construct validity concordance. Multivariate Behavioral Research, 28 (1), 67-96.

Flora, D. B., & Curran, P. J. (2004). An empirical evaluation of alternative methods of estimation for confirmatory factor analysis with ordinal data. Psychological Methods 9(4), 466-491.

Francis, K., Fioriello, A., Robichaud, M., & Dugas, M. J. (2000). The relationship between beliefs about worry and gender. Poster presented at the 3rd annual convention of the Association Troubles Anxieux du Quebec, Montreal, Canada, November 2000.

Freeston, M., Rheaume, J., Letarte, H., Dugas, M. J., & Ladouceur, R. (1994). Why do people worry? Personality and Individual Differences, 17, 791-802.

Fresco, D. M., Frankel, A., Mennin, D. S., Turk, C. L., & Heimberg, R. G. (2002a). Distinct and overlapping features of rumination and worry: The relationship of cognitive production to negative affective states. Cognitive Therapy and Research, 26, 179-188.

Fresco, D. M., Heimberg, R. G., Mennin, D. S., & Turk, C. L. (2002b). Confirmatory factor analysis of the Penn State Worry Questionnaire. Behaviour Research and Therapy, 40, 313-323.

Van Ginkel, J. R., & Van der Ark, L. A. (2005). SPSS syntax for missing value imputation in test and questionnaire data. Applied Psychological Measurement, 29, 152-153.

Glöckner-Rist, A. (Hrsg.) (2006). ZUMA-Informationssystem. Elektronisches Handbuch sozialwissenschaftlicher Erhebungsinstrumente. ZIS Version 10.00. Mannheim: Zentrum für Umfragen, Methoden und Analysen.

HotwordStyle=None; Glöckner-Rist, A., & Hoijtink, H. (2003). The Best of both worlds: Factor analysis of dichotomous data using item response theory and structural equation modelling. Structural Equation Modelling, 10(4), 544-565.

Hazlett-Stevens, H., Ullman, J. B., & Craske, M. G. (2004). Factor structure of the Penn State Worry Questionnaire. Examination of a method factor. Assessment, 11, 361-370.

Hiller, W., & Rief, W. (2004). Internationale Skalen für Hypochondrie. Deutschsprachige Adaptation des Whiteley-Index (WI) und der Illness Attitude Scales (IAS) (Manual). Bern: Huber.

Hock, M., & Krohne, H. W. (1992). Die Erfassung von Intoleranz gegenüber Unsicherheit und emotionaler Erregung: Erste Ergebnisse mit einem Fragebogenverfahren (Mainzer Berichte zur Persönlichkeitsforschung Nr. 40). Mainz: Johannes Gutenberg-Universität, Psychologisches Institut.

Jackson, D. N., & Messick, S. J. (1957). A note on »ethnocentrism« and acquiescent response sets. Journal of Abnormal and Social Psychology, 3, 54-134.

Ladouceur, R., Talbot, F., & Dugas, M. J. (1997). Behavioural expressions of intolerance of uncertainty in worry. Behaviour Modification, 21, 355-371.

Löwe, B., Spitzer, R. L., Zipfel, S., & Herzog, W. (2002). Gesundheitsfragebogen für Patienten (PHQ-D). Komplettversion und Kurzform. Testmappe mit Manual, Fragebögen, Schablonen. 2. Auflage. Karlsruhe: Pfizer GmbH.

Marsh, H. W. (1996). Positive and negative global self-esteem: A substantively meaningful distinction or artifactors? Journal of Personality and Social Psychology, 70, 810-819.

Meyer, T. J., Miller, M. L., Metzger, R. L., & Borkovec,T. D. (1990). Development and validation of the Penn State Worry Questionnaire. Behaviour Research and Therapy, 28, 487-496.

Muthén, L., & Muthén, B. O. (2005). Mplus User´s Guide. Los Angeles, CA: Muthén & Muthén.

Pratt, P., Tallis, F., & Eysenck, M. (1997). Information-processing, storage characteristics and worry. Behaviour Research and Therapy, 35, 10015-1023.

Prüfer, P., & Rexroth, M. (2004). Akzeptanz des Wohlfahrtsstaats, Kognitiver Pretest. ZUMA-Projektbericht 05/2004. Mannheim: Zentrum für Umfragen, Methoden und Analysen.

van Rijsoort, S., Emmelkamp, P., & Vervaeke, G., (1999). The Penn State Worry Questionnaire and the Worry Domains Questionnaire: structure, reliability and validity. Clinical Psychology and Psychotherapy, 6, 297307.

Robinson, J. P., Shaver, P. R., & Wrightsman, L. S. (1991). Measures of personality and social psychological attitudes. New York: Academic Press.

Rorer, L. G. (1965). The great response style myth. Psychological Bulletin, 63, 129-156.

Schimmack, U., Böckenholt, U., & Reisenzein, R. (2002). Response styles in affect ratings: Making a mountain out of a molehill. Journal of Personality Assessment, 78, 461483.

Schmitt, N., & Stults (1985). Factors defined by negatively keyed items: The result of careless respondents? Applied Psychological Measurement, 9, 367-373.

Stöber, J. (1995). Besorgnis: Ein Vergleich dreier Inventare zur Erfassung allgemeiner Sorgen. Zeitschrift für Differentielle und Diagnostische Psychologie, 16, 50-63.

Tomás, J., & Oliver, A. (1999). Rosenberg´s Self-Esteem Scale: Two factors or method effects. Structural Equation Modeling, 6, 84-98.

Weems, G. H., Onwuegbuzie, A. J., & Lustig, D. (2003). Profiles of respondents who respond inconsistently to positively- and negatively-worded items on rating scales. Evaluation and Research in Education, 17, 4560.