Instruktion
Beantworten Sie bitte jede der folgenden Fragen, indem sie entweder "Ja" oder "Nein" ankreuzen:
Items
Nr. |
Item |
1 |
Machen Sie sich oft Sorgen, möglicherweise eine ernsthafte Krankheit zu haben? |
2 |
Werden Sie durch eine Vielzahl von Schmerzen geplagt? |
3 |
Sind Sie sich oftmals der verschiedenen Vorgänge bewusst, die in Ihrem Körper vor sich gehen? |
4 |
Machen Sie sich viele Sorgen über Ihre Gesundheit? |
5 |
Haben Sie oftmals die Symptome einer sehr ernsthaften Krankheit? |
6 |
Wenn Sie auf eine Krankheit aufmerksam gemacht werden (durch Radio, Fernsehen, Zeitung oder einen Bekannten), machen Sie sich dann Sorgen, dass Sie diese Krankheit auch bekommen könnten? |
7 |
Wenn Sie sich krank fühlen und jemand sagt Ihnen, dass Sie bereits wieder besser aussehen - ärgert Sie das? |
8 |
Finden Sie, dass Sie von einer Vielzahl unterschiedlicher Symptome geplagt werden? |
9 |
Ist es schwer für Sie, einmal nicht an sich zu denken, sondern an alle möglichen anderen Dinge? |
10 |
Können Sie dem Arzt nur schwer glauben, wenn er Ihnen sagt, dass kein Grund zur Besorgnis besteht? |
11 |
Bekommen Sie das Gefühl, dass die Leute Ihre Krankheit nicht ernst nehmen? |
12 |
Denken Sie, dass Sie sich mehr Sorgen über Ihre Gesundheit machen als die meisten anderen Leute? |
13 |
Denken Sie, dass mit Ihrem Körper ernsthaft etwas nicht in Ordnung ist? |
14 |
Haben Sie Angst, krank zu werden? |
Antwortvorgaben
Binäre Antworten: Ja (kodiert 1) oder Nein (kodiert 0).
Auswertungshinweise
Wenn die Antworten mit 0 (Nein) und 1 (Ja) kodiert werden, kann ein Gesamtpunktewert zwischen 0 und 14 bzw. bei Ausschluss des wenig formal validen Items 3 zwischen 0 und 13 erreicht werden. Dieser sollte wegen der wiederholt belegten Mehrdimensionalität des Instruments jedoch nur für ein Screening eigesetzt werden. Für Prüfungen theoretischer Fragen sollten demgegenüber, auch statt Summenwerten für jede der drei WI-d Dimensionen, konfirmatorische Mess- und Strukturmodelle herangezogen werden, um Einflüsse zufälliger und systematischer nicht im Modell erfasster Variablen berücksichtigen zu können.
Anwendungsbereich
Das Instrument eignet sich für ein Screening hypochondrischer Störungen insbesondere in nicht-klinischen Populationen und für einen Einsatz zur Untersuchung theoretischer Fragen.
Die Hypochondrie gehört zu den somatoformen Störungen, bei denen für quälende und ängstigende körperliche Symptome medizinisch keine organische Ursache ermittelt werden kann. Patienten mit diesen Störungen beanspruchen aber gerade deshalb das Gesundheitssystem stark (z.B. Rief & Hiller, 1998). Deshalb entwickelte Pilowsky bereits 1967 für den englischsprachigen Raum den Whiteley Index (WI). Mit 14 dichotomen Items (nein vs. ja) soll er hypochondrische Einstellungen und Überzeugungen erfassen, um Personen mit Verdacht auf Hypochondrie frühzeitig identifizieren und einer spezialisierten Behandlung zuführen zu können. Der WI wurde mittlerweile in verschiedene Sprachen übersetzt und in einer Vielzahl von Studien in verschiedenen Ländern eingesetzt. Die hier dokumentierte deutsche Version (WI-d) stammt von Rief et al. (1994; Hiller & Rief, 2004).
Die 14 Items des englischen Originals wurden aus einer größeren Zahl von Aussagen zur klinischen Charakterisierung einer hypochondrischen Störung durch das medizinische Personal der Whiteley Klinik, UK, abgeleitet. Diese Items wurden jeweils 100 Patienten mit und ohne Diagnose einer Hypochondrie vorgegeben. Beibehalten wurden 14 Items, die von ihnen signifikant unterschiedlich beantwortet wurden.
Nach einer Hauptkomponentenanalyse (PCA) der Antworten der 200 Patienten zu diesen 14 Items erfassen sie drei diskriminierbare Facetten von Hypochondrie. Ein Teil der Items ist nach Komponentenladungen < . 40 aber schon bei Pilowsky (1967) wenig formal valide (vgl. Tabelle 1)
Items des WI (geordnet nach eigenen FA Ergebnissen) und Prozentsatz ihrer Bejahung durch Patienten mit (1; Pilowsky, 1967, N = 100) und ohne somatoforme Störungen (2; Pilowsky, 1967, N = 100), Münsteraner Studierende (3; N = 581) und australische Hausarztpatienten (4; Conradt et al., 2006, N = 1800); (Komponentenladungen nach Pilowsky (1967): Symptombelastung, Krankheitsangst, Krankheitsüberzeugung)
|
|
1 |
2 |
3 |
4 |
Symptombelastung (Bodily Preoccupation) |
|
|
|
|
|
2 |
Werden Sie durch eine Vielzahl von Schmerzen geplagt? |
76 |
19 |
09 |
38 |
(-.51 -.10 -.18) |
|||||
5 |
Haben Sie manchmal die Symptome einer sehr ernsthaften Krankheit? |
40 |
08 |
12 |
08 |
(-.28 .03 .13) |
|||||
8 |
Finden Sie, dass Sie von einer Vielzahl unterschiedlicher Symptome geplagt werden? |
63 |
10 |
13 |
19 |
(-.41 .04 -.03) |
|||||
13 |
Denken Sie, dass mit Ihrem Körper ernsthaft etwas nicht in Ordnung ist? |
44 |
07 |
08 |
12 |
(-.08 .08 .37) |
|||||
3 |
Sind Sie sich oftmals der verschiedenen Vorgänge bewusst, die in Ihrem Körper ablaufen? |
65 |
18 |
49 |
57 |
(-.29 .03 .05) |
|||||
Krankheitsangst/Gesundheitssorgen (Disease Phobia) |
|
|
|
|
|
1 |
Machen Sie sich oft Sorgen, möglicherweise eine ernsthafte Krankheit zu haben (z. B. Krebs, Schizophrenie, Schlaganfall usw.)? |
72 |
16 |
20 |
23 |
(-.25 .17 -.04) |
|||||
4 |
Machen Sie sich viele Sorgen um Ihre Gesundheit? |
85 |
33 |
28 |
27 |
(-.40 .26 -.11) |
|||||
6 |
Wenn Sie auf eine Krankheit aufmerksam gemacht werden (durch Fernsehen, Zeitung oder einen Bekannten), machen Sie sich dann Sorgen, dass Sie diese Krankheit auch bekommen? |
45 |
03 |
30 |
16 |
(-.15 .50 .03) |
|||||
12 |
Denken Sie, dass Sie sich mehr Sorgen über Ihre Gesundheit machen als die meisten anderen Leute? |
55 |
13 |
10 |
12 |
(-.15 .46 .12) |
|||||
14 |
Haben Sie Angst, krank zu werden? |
61 |
32 |
40 |
35 |
(-.12 .59 -.02) |
|||||
Krankheitsüberzeugung (Disease Conviction) |
|
|
|
|
|
7 |
Wenn Sie sich krank fühlen und jemand sagt Ihnen, dass Sie bereits wieder besser aussehen ärgert Sie das? |
24 |
08 |
11 |
11 |
(.17 .02 .52) |
|||||
9 |
Ist es schwer für Sie, einmal nicht an sich zu denken, sondern an alle möglichen anderen Dinge? |
56 |
37 |
09 |
18 |
(.03 .49 .14) |
|||||
10 |
Können Sie dem Arzt nur schwer glauben, wenn er Ihnen sagt, dass kein Grund zur Besorgnis besteht? |
72 |
28 |
09 |
13 |
(-.18 .24 .16) |
|||||
11 |
Bekommen Sie das Gefühl, dass die Leute Ihre Krankheit nicht ernst nehmen? |
53 |
27 |
14 |
11 |
(.12 -.10 .47) |
Anmerkung. Whiteley Items im Internet z.B.: http://www.neuro24.de/show_glossar.php?id=1791
In weiteren Studien (vgl. Tabelle 2) wurden weniger Dimensionen beibehalten oder einzelne Items anderen Dimensionen zugeordnet: So bestätigten Studien von Rief et al. (1994), Hiller, Rief und Fichter (2002) sowie Hinz, Rief und Brähler (2003) zwar die von Pilowsky konstatierte Dreidimensionalität des WI. Die Items 13, 4 und 9 ordneten sich dort z.T. aber anderen Komponenten zu als bei Pilowsky und anderen Autoren.
Dimensionsanalytische Studien zum Whiteley Index
Jahr |
Autoren |
Stichprobe |
Methode (ausgeschlossene bzw. wenig formal valide Items) |
Anzahl Dimensionen und Prozentsatz aufgeklärter Varianz (V); Faktor-Itemzuordnung |
1994 |
Rief et al. |
200 stat. psychiatr. Pat. + psycho-som. Symp. |
PCA/Varimax; Höhe akzep. Ladungen HAL >.40 (3) |
3; 49% V; SB: 2, 5, 8 KA: 1, 4, 6, 12, 13, 14 KÜ: 7, 9, 10, 11 |
1996 |
Speckens et al. |
115 ambulante Pat. 107 Hausarztpat., 185 Allgemeinbevölk. |
PCA/Varimax; HAL >.15 (3, 7, 9) |
1; 31% V; Items 1-14 |
1999 |
Fink et al. |
99 Hausarztpat., 100 stat. neurolog. Pat. |
2 und 1 Parameter IRT Modelle; HAL >.50 (3, 5, 7, 9, 11, 12) |
1 oder 2; 50% V; 1F: 1, 2, 4, 6, 8, 10, 13 KA: 1, 4, 6 KÜ: 2, 8, 10 |
2002 |
Hiller et al. |
570 stat. psychiatr. Pat. + psycho-som. Symp. |
PCA/Varimax; HAL > .40 (3)
|
3; 55% V*: SB: 2, 5, 8 KA: 1, 4, 6, 12, 13, 14 KÜ: 7, 9, 10, 11 |
2003 |
Hinz et al. |
1999 Befragte aus Allgemeinbevölkerung |
PCA/Varimax HAL > .40 (3, 9, 12) |
3; 51% V; SB: 1, 2, 5, 8, 13 KA: 4, 6, 14 KÜ: 7, 10, 11 |
2006 |
Conradt et al. |
1800 Hausarztpatienten |
lineare CFA (WLS, tetrachorische Korrel.) Vergleich der Modelle der anderen Studien |
3 wie Hiller und Rief; Präferenz 7 Item Kurzform wie Fink et al., aber als 1 dim. interpretiert |
Anmerkung. HAL = Höhe akzeptierter Faktorladungen, SB = Symptombelastung, KA = Krankheitsangst; KÜ = Krankheitsüberzeugung
Weitere Items erwiesen sich erneut als wenig formal valide, darunter durchgängig Item 3 (vgl. Tabelle 2), das als einziges nur Körperaufmerksamkeit erfasst. Speckens et al. (1996) beurteilten jedoch alle 14 Items als eindimensional. Eine weitere Studie (Fink et al., 1999) empfiehlt dagegen nach einer Item Response Theorie (IRT) Modellanalyse den Ausschluss der Hälfte der Items aufgrund von Trennschärfen < .50. Die Autoren schließen jedoch nicht aus, dass sechs der beibehaltenen sieben Items (vgl. Tabelle 2), die aus allen drei Subskalen des WI stammen, zwei statt nur eine Skala bilden: Eine Subskala Illness Worrying mit drei der Krankheitsangstitems nach Pilowsky (1, 4, 6), sowie eine Subskala Illness Conviction mit zwei Symptombelastungsitems (2, 8) und einem Krankeitsüberzeugungsitem (10). Nur die zweite Subskala identifizierte jedoch zufriedenstellend spezifisch und sensitiv Patienten mit somatoformen Störungen. Conradt et al. (2006) überprüften alle bisherigen Dimensionslösungen mit linearen konfirmatorischen Faktoranalysen (CFA). Danach war das Modell von Hinz et al. (2003) das Beste. Die Autoren favorisieren jedoch die 7- Item Version von Fink et al. (1999), obwohl deren Items auch nach ihren Analysen eventuell zwei Faktoren zugeordnet werden könnten. Sie interpretieren die hohe Interkorrelation der Items jedoch als Evidenz für eine eindimensionale Verursachung der Kovarianzen der Antworten zu allen sieben Items.
Weitere psychometrische Analysen wurden zur Sicherung der Validität und Reliabilität des WI durchgeführt. Die Reliabilität des Gesamtinstruments wurde aufgrund eines Cronbachs Alpha von .83 für alle Items (Hinz et al., 2003) und einer Retestreliabilität von .83 (72 Stunden-Intervall; Rief et al., 1994) als zufriedenstellend beurteilt. Als Beleg für die konvergente Validität des WI wurden z.B. hohe Korrelationen (.80; z.B. Hiller et al., 2002) zwischen den Antwortsummenwerten des WI und anderen Instrumenten zu Krankheitsängsten angeführt.
a) Worauf könnten diese widersprüchlichen Ergebnisse zur Dimensionalität des WI zurückzuführen sein? In verschiedenen Studien wurden unterschiedlich hohe Faktorladungen als Kriterium für die Beibehaltung von Items herangezogen und unterschiedliche Gruppen von Personen untersucht, u.a. psychiatrische vs. klinisch unauffällige Personen (vgl. Tabelle 2). Zu den heterogenen Befunden könnten auch die verwendeten Methoden beigetragen haben. So wurden in der Mehrzahl der Studien PCA oder lineare Faktorenanalysen (FA) berechnet, obwohl sie für dichotome Itemantworten zu inkonsistenten Parameterschätzungen und Standardfehlern führen und auch aus weiteren Gründen nicht zur Beantwortung von Fragen geeignet sind, die in den zitierten Arbeiten über den WI zu beantworten intendiert wurden. So ist eine PCA grundsätzlich für die Klärung der Frage nach einer Itembeantwortungen zugrundeliegenden dimensionalen Struktur wenig geeignet: Sie ist kein modellbasiertes, sondern nur ein datenreduzierendes Verfahren, das lediglich eine Aufklärung von Itemgesamtvarianzen anstrebt und nicht wie eine FA die Erklärung von Antwortkovarianzen durch Einflüsse zugrundliegender hypothetischer Konstrukte. Ein Einsatz von FA Modellen wäre also in der Mehrzahl dieser Studien angemessener gewesen. Ferner wurden in allen PCA Studien Varimax statt obliquer Rotationen durchgeführt, obwohl die WI Komponenten nach allen Studien substantiell korreliert sind. Dadurch werden aber, und dies gilt gleichermaßen für explorative Faktorenanalyse (EFA) Modelle, Unterschätzungen der Multidimensionalität von Items wahrscheinlich, da substanzielle Assoziationen von Items mit mehr als einer Komponente bzw. einem Faktor durch eine orthogonale Rotation reduziert werden können. Dies könnte erklären, warum sich in etwa gleich hoch mit zwei oder mehr Dimensionen bzw. Komponenten korrelierte Items in verschiedenen Studien bzw. Stichproben mit jeweils etwas unterschiedlichem Gewicht jeweils einer anderen dieser Dimensionen zuordnen.
Conradt et al. (2006) verwendeten zwar geeignetere CFA Modelle und analysierten damit die asymptotische Kovarianzmatrix tetrachorischer Korrelationen mit einem WLS Schätzer, um die fehlende Normalverteilung der binären Indikatoren zu berücksichtigen. Nur die von Fink et al. (1999) eingesetzten 2 (Item-)Parameter IRT Modelle wurden jedoch speziell für Analysen binärer und polytomer Indikatoren entwickelt, und berücksichtigen nicht nur nicht kontinuierliche Verteilungen manifester Indikatoren, sondern auch nichtlineare Zusammenhänge zwischen diesen und ihren Konstrukten. Formal können sie als nichtlineare Varianten des traditionellen linearen Faktoranalysemodells parametrisiert werden, das zusätzlich die ersten Momente modelliert, um neben Faktor-Indikator Assoziationen auch die Schwierigkeit als zweiten Itemparameter abzubilden (zsf. z.B. Glöckner-Rist & Hoijtink, 2003). Die von Fink et al. (1999) mit diesen Modellen ermittelte Lösung befriedigt aber aus mehreren anderen Gründen trotzdem weder inhaltlich noch methodisch: Die Autoren berücksichtigten nur die Antworten zur Hälfte der Items. Unter den eliminierten befanden sich auch solche, die selbst in Studien mit PCA angemessen mit ihren Komponenten assoziiert waren. Die Autoren schlossen zudem eine zweidimensionale Struktur für sechs der sieben beibehaltenen Items nicht aus. Warum das siebte Item aus dieser Struktur herausfällt, wurde nicht diskutiert. Die theoretische Interpretation ihrer Krankheitsüberzeugungssubskala ist unklar: Sie enthält zwei in allen anderen Studien Symptombelastung indizierende Items und nur ein, wenn auch das wesentlichste, Krankheitsüberzeugungsitem. Die Mehrzahl aller anderen Studien fand drei substanziell assoziierte Subdimensionen. Anscheinend hat die untersuchte Störung drei hoch dependente, aber statistisch diskriminierbare Facetten. Werden aber im Gesamtkontext des WI beantwortete Items aus diesem Kontext herausgelöst analysiert, so ordnen sie sich einer Subskala nicht notwendig deshalb zu, weil ihre Beantwortung in gleicher Weise wie zuvor durch eine allen zugrunde liegende gemeinsame Dimension beeinflusst wird. Genauso plausibel ist, dass nur noch funktionale Abhängigkeiten zwischen den Items die Kovariationen ihrer Beantwortungen determinieren.
Hier wird deshalb die Dimensionalität des WI erneut mit IRT Modellen geprüft. Sie werden jedoch in einem verallgemeinerten Strukturgleichungsansatz (SEM; Muthén, 2002) eingesetzt und mit dem Programm Mplus (4.1; Muthén, & Muthén, 1998-2007) berechnet. Dadurch können auch für solche Modelle die Möglichkeiten genutzt werden, die der konventionelle konfirmatorische SEM Ansatz für die Spezifikation und Schätzung linearer faktoranalytischer Modelle bietet, wie explizite Spezifikationen des Grads der Einfachstruktur von Dimensionen und der Unkorreliertheit bzw. Korreliertheit von Residuen.
b) Sind ausschließlich dimensionsexplorierende Verfahren überhaupt geeignet, die Fragen zu untersuchen, zu deren Beantwortung der WI konstruiert wurde? Der WI soll u.a. ein Screening hypochondrischer Störungen insbesondere in nicht-klinischen Populationen ermöglichen. Hiller et al. (2002) zeigten, dass ein Cut-off-Wert von 8 für den Gesamtsummenwert die Sensitivität und Spezifität eines solchen binären Screenings optimiert. Die Verwendung des WI Gesamtsummenwerts für diesen Zweck wird, wie häufig auch bei anderen Screening Instrumenten, dadurch gerechtfertigt, dass das Gesamtinstrument nach Analysen wie den oben für den WI berichteten, konsistent, reliabel und valide sei. Wenn Dimensionalitätsprüfungen jedoch gleichzeitig eine mehrdimensionale Strukturierung der Antworten nahelegen, sind solche psychometrischen Prüfungen für Gesamtinstrumente aber auch nach den Axiomen der Klassischen Testtheorie (KTT; zsf. Lord & Novick, 1968) unzulässig. Nach der KKT können nur Werte für eindimensionale, d.h. semantisch homogene und damit strukturell valide Itemantworten aufsummiert und so in Konsistenz-, Reliabilitäts- und Validitätsprüfungen einbezogen werden, da nur solche Summenwerte sinnvoll als Substitute für Ausprägungen auf einem zugrundeliegenden Konstrukt interpretierbar sind. Itemhomogenität ist jedoch für einen Einsatz von Summenwerten für Screeningzwecke nicht notwendig. Im Gegenteil: die Abdeckung möglichst vieler einschlägiger Syndrombereiche, und damit Multidimensionalität eines Summenwertes, kann die Screeningperformanz durch Erhöhung der Sensitivität deutlich steigern. Konventionelle psychometrische Analysen zur Beurteilung der Reliabilität und Validität des gesamten WI sind aufgrund seiner theoretisch und empirisch offenkundigen Mehrdimensionalität deshalb nicht sinnvoll. Die Spezifität eines Screenings könnte jedoch durch die Berücksichtigung einer solchen Multidimensionalität durch entsprechend gewichtete Summenwerte verbessert werden. So ist, wie auch Fink et al. (1999) richtig anmerkten, trotz der vielen Untersuchungen mit und über den WI unklar, inwieweit er auch andere somatoforme Störungen wie Gesundheitsängste zuverlässig identifizieren könnte, die zwar eng mit Hypochondrie zusammenhängen, aber nicht deren Kriterien erfüllen. Die Untersuchung dieser Frage erfordert jedoch eine detaillierte Analyse von Antwortprofilen statt nur eine von Summenwerten, zu dem die Antworten zu allen Items gleichgewichtig beitragen. Dazu geeignete Latent Class Analysen (LCA) wurden bisher nur in einer Arbeit von Fink et al. (2004) eingesetzt und zur Klassifizierung beteiligter Hausarztpatienten wurden keine WI Antwortprofile herangezogen, sondern nur in einem Interview erfragte Hypochondriesymptome. Deshalb werden hier ergänzend mit dem Programm LatentGold (Vermunt & Magidson, 2005) berechnete konventionelle LCA Modelle und zudem neuere hybride Modelle eingesetzt, die erstere auf verschiedene Weise mit nicht linearen IRT Modellen kombinieren.
Fink et al. (2004) zogen die von Fink et al. (1999) vorgeschlagene 7 Item WI Version gemeinsam mit anderen Instrumenten heran, um aus ursprünglich 1785 dänischen Hausarztpatienten 701 Patienten für weitere psychiatrische Untersuchungen auszuwählen. Diese 701 Patienten wurden dann aufgrund von Symptomprofilen klassifiziert, die in diesen psychiatrischen Interviews erfragt wurden. Ermittelt wurden drei Subgruppen von Patienten mit unterschiedlichen Auftretenswahrscheinlichkeiten für sechs von neun in den Interviews erfragten Symptomen: In einer Klasse Hypochondrie (14.6%) waren insbesondere Grübeln (rumination) über Krankheit häufig, aber auch alle übrigen klassifizierungsrelevanten Symptome. Für eine zweite Klasse mit anderen somatoformen Störungen (34.8%) war demgegenüber Grübeln über Krankheit deutlich weniger wahrscheinlich, die meisten der übrigen Symptome aber vergleichbar wahrscheinlich. Für eine dritte Klasse ohne somatoforme Störungen (N = 335 = 50.6%) hatten alle Symptome Wahrscheinlichkeiten < .11. Nach den Autoren bedeutet dies, dass Grübeln über Krankheit mit zusätzlich wenigstens einem der anderen Symptome "form a distinct diagnostic entity performing better than the current DSM-IV hypochondriasis diagnosis. However, these criteria are preliminary, awaiting cross-validation in other subject groups" (Fink et al., 2004, p. 1680).
Itemkonstruktion und Itemselektion
Zur Generierung der Items der Originalversion des Whiteley-Index (WI; Pilowsky, 1967) wurden 100 medizinisch und pflegerisch tätige Mitarbeiter des United Sheffield Hospitals der Whiteley Klinik (UK) darum gebeten, Hypochondrie zu definieren. Die häufigsten Definitionen wurden in einzelne Aussagen zerlegt, die dann nach inhaltlicher Ähnlichkeit gruppiert wurden. Weitere Items wurden theoretisch abgeleitet. So gewonnene 20 Items wurden von jeweils 100 Patienten ohne und mit Diagnose einer Hypochondrie beantwortet. 17 dieser Items wurden signifikant häufiger von den hypochondrischen als von den nicht hypochondrischen Patienten bejaht. 14 von ihnen wurden dann in die Endversion des WI übernommen. Die hier dokumentierte deutsche Version (WI-d) erstellten Rief et al. (1994; Hiller & Rief, 2004).
Stichproben
Den hier berichteten psychometrischen Analysen liegen die Daten von 581 Studierenden der Universität Münster zugrunde, denen der WI-d gemeinsam mit weiteren Instrumenten in einer Befragung im Jahr 2005 vorgelegt wurde. Die Daten von weiteren 19 Teilnehmern dieser Befragung wurden nicht berücksichtigt, weil sie mehr als 40% der WI-d Items oder der Items von zur Validierung herangezogenen weiteren Itembatterien nicht beantwortet haben. 67% der 581 Befragten waren weiblich. Ihr Durchschnittsalter betrug 20.7 Jahre (Streubreite: 18 bis 39 Jahre).
Zum Vergleich werden auch Daten aus zwei weiteren Studierendenstichproben berichtet. Sie hatten den WI-d bereits in Erhebungen in 2003 (N = 908) und 2004 (N = 731) beantwortet. Diese wurden in vergleichbarer Weise wie die Studie in 2005 durchgeführt, jedoch mit zum Teil anderen weiteren Itembatterien.
Durchführung
Die Erhebung erfolgte an 20 Tagen von August bis Oktober 2005. Befragt wurden wie auch schon in 2003 und 2004 Studierende, die sich zu den verschiedenen Studiengängen der Westfälischen Wilhelms-Universität Münster einschrieben. Sie wurden von DiplomandInnen des Fachbereichs Psychologie während ihres Wartens vor dem Einschreibungsbüro darauf angesprochen, ob sie bereit wären, an einer Fragebogenstudie zu "Gesundheitsverhalten und Wohlbefinden" teilzunehmen. Allen Angesprochenen wurde erklärt, dass es sich nicht um eine mit der Einschreibung zusammenhängende Befragung handele und dass die Teilnahme freiwillig sei. Die Wahrung der Anonymität wurde zugesichert. Die Instruktion der Befragten erfolgte über schriftliche Kurzanweisungen zu den verschiedenen Itembatterien des Fragebogens. Sie wurden jedoch darauf aufmerksam gemacht, dass die Versuchsleiter für Rückfragen jederzeit zur Verfügung stünden.
Variablen und Auswertungsmethode
Messmodellanalysen: Alle hier berichteten Dimensionsanalysen erfolgten mit konfirmatorischen Mess- und Strukturmodellen für nicht kontinuierlich verteilte manifeste Indikatoren und kontinuierliche latente Variablen. Benutzt wurde dazu Mplus 4.1. Es ermöglicht eine Spezifikation und Prüfung solcher Modelle als 2-Parameter-Normalogiven IRT-Modelle in einem integrierten und verallgemeinerten Ansatz zur Formulierung und Testung von Mess- und Strukturmodellen mit latenten Variablen (vgl. zsf. Glöckner-Rist & Hoijtink, 2003).
Alle Modelle wurden mit einem robusten, mittelwerts- und varianzadjustierten WLS Schätzer (WLSMV) berechnet. Im Vergleich zum traditionellen WLS Schätzer führt er bei eher geringen Stichprobenumfängen wie der unsrigen zu stabileren und weniger inflationären Parameterschätzungen (vgl. z.B. Flora & Curran, 2004). Wie traditionell in Faktorenanalysen dichotomer Itemantworten üblich, werden auch im 2-Parameter IRT-Modell tetrachorische Korrelationen analysiert.
Obwohl sie wegen ihrer Teststärke mit steigenden Stichprobenumfängen zu häufig eine Ablehnung von Modellen nahelegen, werden für die statistische Beurteilung der allgemeinen Modellpassung wie üblich c2-Werte berichtet (zsf. Bollen, 1989). Für mit WLSMV geschätzte, hierarchisch genestete Modelle berechnet Mplus c2-Differenzentests, die korrigierend berücksichtigen, dass die Prüfgrößen für solche Modelle nicht c2-verteilt sind. Als deskriptive Anpassungsmaße werden die Werte für den Comparative Fit Index (CFI), den Tucker Lewis Index (TLI) und den Root Mean Square Error of Approximation (RMSEA) berichtet. CFI- und TLI-Werte < .90 bzw. >.95 sowie RMSEA-Werte .10 bzw. nahe .05 oder geringer werden als Hinweis auf eine unzureichende bzw. gute Modellanpassung interpretiert, Werte im Zwischenbereich als Hinweis für eine akzeptable Modellpassung (zsf. Bollen, 1989). Zur Identifizierung der Modelle wurde jeweils der unstandardisierte Regressionspfad für ein Item für jede Dimension eines Messmodells auf 1 fixiert.
Klassenanalysen: Um die plausibelste Klassenanzahl zu identifizieren, wurden zunächst konventionelle LCA Modelle mit einer zunehmenden Anzahl nominaler latenter Klassen berechnet und vergleichend beurteilt. Anschließend wurde mit LCFA Modellen geprüft, ob die Annahme von ein oder mehreren ordinal geordneten latenten Klassenvariablen besser zu den Daten passt als die Annahme nur einer zugrunde liegenden nominalen Klassenvariable. Ferner wurde zusätzlich ein kontinuierlicher Faktor einbezogen, um zu ermitteln, ob die Beantwortung einzelner Items systematisch durch zusätzliche, nicht somatoform bedingte Faktoren mit beeinflusst wurde.
Alle hier berichteten LCA Analysen erfolgten mit LatentGold (Version 4; Vermunt & Magidson, 2005): Insbesondere LCFA können mit diesem Programm sehr viel einfacher als mit Mplus durchgeführt werden, weil dazu keine Syntaxskripte mit z.T. relativ aufwendigen Parameterspezifikationen erstellt werden müssen. Seit Version 4.0 berechnet LatentGold für kombinierte Klassen- und Faktorenmodelle auch linear approximierte standardisierte Faktorladungen und Faktorinterkorrelationen, obwohl die zugrunde liegende Faktorstruktur mit dem reliableren nichtlinearen Faktormodell ermittelt wird. Diese sind bekanntermaßen deutlich leichter zu interpretieren als die loglinearen Parameter dieser Modelle.
Die Auswahl der abschließend beibehaltenen Klassenlösung erfolgte zentral gestützt auf ihre inhaltliche Plausibilität und unter Berücksichtigung der folgenden statistischen Kennwerte:
a) Des Bayes Informationskriteriums (BIC). Anders als die zur statistischen Prüfung der globalen Modellpassung geeignete Loglikelihood Ratio Statistik erlaubt das BIC zwar nur deskriptive Beurteilungen von Modellverbesserungen bzw. -verschlechterungen, eignet sich aber auch für einen Vergleich der Anpassung strukturell unterschiedlicher Modelle. Theoretisch sind für den WI zudem 213 verschiedene Symptomprofile zu erwarten. Schon aus der Stichprobengröße ist jedoch abzuleiten, dass die Zahl der tatsächlich aufgetretenen Profile deutlich niedriger ist. Unter solchen Bedingungen ist die Loglikelihood Ratio Statistik häufig nicht mehr Chi-quadrat verteilt. Sie wurde deshalb bei der Entscheidung über die beizubehaltende Klassenlösung nicht berücksichtigt.
b) Der Klassifikationsgüte nach einem dafür durch LatentGold ermittelten Klassifikationsfehler. Er beschreibt den Anteil eventuell falsch klassifizierter Personen.
c) Als weiteres Kriterium wurde geprüft, ob signifikante Residuenkorrelationen auf nicht hinreichend durch ein Modell erklärte Variablenzusammenhänge hinwiesen.
Validitätsprüfungen: Um die Konstruktvalidität identifizierter WI-d Dimensionen zu beurteilen, wurde das akzeptierte Messmodell für den WI-d gemeinsam mit denen für andere Konstrukte in ein Strukturmodell integriert. Herangezogen wurden dazu Items der folgenden Instrumente, deren faktorielle Struktur dazu vorab jeweils ebenfalls mit 2 Parameter Normalogivenmodellen geprüft wurde:
1) 11 eindimensionale Items (vgl. Glöckner-Rist & Rist, 2005) aus einer deutschen Version des Penn State Worry Questionnaire (PSWQ-d; Stöber, 1995). Sie sollen exzessives und unrealistisches sowie als unkontrollierbar erlebtes Sorgen als zentrales Merkmal der generalisierten Angststörung mit einem 5-stufigen Antwortformat (0 = überhaupt nicht, 4 = äußerst typisch für mich) ermitteln.
2) 39 Items einer modifizierten deutschen Version des Symptom Interpretation Questionnaire (SIQ-d), den Robbins und Kirmayer (1986) ursprünglich für den englischsprachigen Raum konstruiert hatten. Sie erfassen die Wahrscheinlichkeit (vierstufig: 0 = gar nicht, 3 = sehr wahrscheinlich), mit der jede von 13 körperlichen Wahrnehmungen (z.B. Magenschmerzen, Herzrasen oder starkes Schwitzen) auf eine somatische, eine psychologische oder eine situative Ursache zurückgeführt werden würde. Zusätzlich zu diesen drei mit Normalogivenanalysen bestätigten Attributionsdimensionen erfasst der SIQ, wie häufig jede körperliche Wahrnehmung erlebt wurde (vierstufig: 0 = nie; 3 = oft). Nach einer Normalogivenanalyse ordnen sie sich zwei Dimensionen zu, die als länger anhaltende (tonische; z.B. Magen und Darmprobleme, Körperliche Erschöpftheit) und kurzzeitige (phasische; z.B. Herzrasen, Schwindel) Auslenkungen vom Normalzustand interpretiert werden können.
3) Acht Items aus dem deutschen Angstsensitivitäts-Index (ASI; Alpers & Pauli, 2001). Mit 5-stufigen Antwortoptionen ("sehr wenig“ bis "sehr stark“) erfragen sie, inwieweit körperliche Wahrnehmungen wie schneller Herzschlag, Kurzatmigkeit sowie Nervosität und Konzentrationsprobleme Angst induzieren. Nach eigenen Normalogivenmodellanalysen ordnen sie sich wie erwartet mit Faktorladungen > .50 einer Dimension zu.
4) 14 Items einer modifizierten deutschen Kurzform des Health Anxiety Inventory (MK-HAI; Bailer & Witthöft, 2006). Die mit 5-stufigen Antwortformaten (0 = starke Ablehnung bis 4 = starke Zustimmung) vorgegebenen Items sollen nach den Konstrukteuren des englischen Originals (Salkovskis et al., 2002) normales, subklinisches gesundheitsbezogenes Sorgen bis hin zu schwerer Hypochondrie als auf einer kontinuierlichen Dimension angeordnet ermitteln (vgl. Bailer & Witthöft, 2006). Nach Bailer et al. bestätigte eine lineare, aber wegen der Schiefe der Antwortverteilungen mit robuster Maximum Likelihood Schätzung (Mplus 2.02) durchgeführte CFA der Daten von 449 Studierenden der Universität Mannheim die von Salkovskis et al. (2002) postulierte einfaktorielle Struktur des HAI. Allerdings wurde eine akzeptable Modellpassung nur erzielt, wenn eine substanzielle Korrelation der Residuen von zwei Items zugelassen wurde, die spezifisch Körperaufmerksamkeit erfassen. Wir analysierten unsere Daten demgegenüber wegen teilweise extremer Schiefverteilung der Itemantworten mit dem IRT Normalogivenmodell. Danach erklärt nur ein Modell mit vier Faktoren die Antwortassoziationen inhaltlich und statistisch zufriedenstellend. Sie lassen sich interpretieren als Krankheitsangst (3 Items), Krankheitssorgen (4 Items), Körperaufmerksamkeit (3 Items), sowie mangelnde Kontrollierbarkeit von Krankheitsgedanken und Gesundheitsangst (4 Items), im Folgenden kurz mangelnde Gedankenkontrolle genannt. Entsprechend wurden vier Messmodelle für den MK-HAI in die Validierungsprüfungen des WI-d einbezogen.
5) Klassenanalysen: Zwar kann die Validität von LCA und LCFA Lösungen mit LatentGold nicht wie mit Mplus dadurch geprüft werden, dass Beziehungen zwischen Messmodellen mit einem Strukturmodell analysiert werden. LatentGold ermöglicht aber Kovariatenanalysen. Deshalb wurde ermittelt, ob eindimensionale Konstrukte, die nach Strukturmodellanalysen signifikant mit WI Dimensionen assoziiert sind, auch für mit dem WI identifizierte Subgruppen bzw. latente Populationssegmente bedeutsam sind. Dazu wurden ihre Mittelwerte als Kovariate in die abschließende Analyse des akzeptierten Klassenmodells einbezogen.
Fehlende Antwortwerte wurden jeweils mit Imputationsalgorithmen der beiden verwendeten Programme ersetzt.
Itemanalysen
Nach ersten Analysen wurde Item 3 wegen seiner zu geringen formalen Validität (Faktorladungen .19) aus allen weiteren Analysen ausgeschlossen. Ein dreidimensionales Modell (Abbildung 1) (c2 = 58.2, p = .05, CFI = .98, TLI = .99, RMSEA = .03) erklärt die Assoziationen zwischen den Antworten zu den übrigen 13 WI-d Items signifikant besser als ein eindimensionales Modell (c2 = 179.3, p = .00, CFI = .85, TLI = .89, RMSEA = .07). Dies betrifft insbesondere die Items, die Symptomüberzeugung als wesentliches Merkmal einer Hypochondrie erfassen sollen. Sie sind alle gering (.31, .32, .44, .52) mit nur einer allgemeinen Dimension assoziiert.
Abbildung 1. Messmodell für den Whiteley-Index auf Deutsch
Zu vergleichbaren Ergebnissen führen IRT Normalogivenanalysen der Daten aus den beiden weiteren Erstsemesterstichproben aus 2003 (N = 908) und 2004 (N = 731). Nach multiplen Gruppenvergleichen unterscheiden sich zudem weder die unstandardisierten Faktorladungen noch die Interzepte bzw. Schwierigkeitsparameter signifikant, die für jede der drei Stichproben ermittelt wurden. Die Unterschiede zwischen den standardisierten Trennschärfen bzw. Faktorenladungen nach den drei Stichproben spiegeln also lediglich stichprobenspezifische Fluktuationen der Itembeantwortungen wider. Nach den Analysen aller drei Datensätze und übereinstimmend mit anderen Studien (vgl. Tabelle 2) sind die Items 7 und 9 am wenigsten formal valide.
Relativ hohe Faktorinterkorrelationen (vgl. Abbildung 1) entsprechen der theoretisch plausiblen funktionalen Dependenz der drei Subdimensionen. Sie stimmen inhaltlich mit den von Rief et al. (1994) und Hiller et al. (2002) identifizierten Komponenten überein, lediglich Item 13 indiziert Symptombelastung statt Krankheitsangst, wie bei Hinz et al. (2003).
Die Passung des dreidimensionalen Modells kann jeweils nochmals merklich verbessert werden (c2 = 37.4, p = .54, CFI = 1.00, TLI = 1.00, RMSEA = .00), wenn
a) das Krankheitsangstitem 12 als auch durch die Dimension Symptombelastung beeinflusst modelliert wird (Faktorladungen zwischen .22 und .27) und wenn Residuenkorrelationen (.16 ‑.26) zugelassen werden für
b) die Items 2 und 8 (vgl. Tabelle 1), die offensichtlich auch deshalb ähnlich beantwortet werden, weil sie sprachlich sehr ähnlich formuliert sind,
c) die Items 6 und 14 (vgl. Tabelle 1), die beide spezifisch anders als die übrigen Items ihrer Dimension eine Bedrohung durch Krankheit bzw. Erkrankungsfurcht statt Sorgen um Gesundheit oder existente Krankheit erfassen sowie
d) die Items 1 und 5 (vgl. Tabelle 1), deren Antworten offensichtlich deshalb zusätzlich kovariieren, weil nur sie Krankheiten als ernsthaft spezifizieren.
WI-d Subgruppen: Nominale LCA legen drei oder vier Subgruppen zur Erklärung unterschiedlicher WI-d Antwortprofile nahe: Die BIC Werte sinken kontinuierlich bis zu KM 3 ab und steigen erst für KM 5 wieder deutlich an. Für KM 3 und 4 sind sie fast identisch (Tabelle 3). Dies legt drei oder vier Subgruppen nahe.
Indizes zur Beurteilung der Güte unterschiedlicher Klassenlösungen (N = 581)
Messmodelle |
D |
G |
BIC |
nP |
%MK |
C1 |
C2 |
C3 |
C4 |
C5 |
LC-Modelle |
|
|
|
|
|
|
|
|
|
|
KM 1 |
- |
1 |
6298 |
13 |
0 |
100 |
|
|
|
|
KM 2 |
- |
2 |
5794 |
27 |
7 |
72 |
28 |
|
|
|
KM 3 |
- |
3 |
5781 |
41 |
12 |
51 |
40 |
9 |
|
|
KM 4 |
- |
4 |
5783 |
55 |
15 |
46 |
35 |
11 |
8 |
|
KM 5 |
- |
5 |
5827 |
69 |
17 |
42 |
22 |
17 |
11 |
8 |
LCFA-Modelle |
|
|
|
|
|
|
|
|
|
|
KM 6 |
2 |
4 |
5712 |
41 |
8 |
46 |
33 |
13 |
9 |
|
LCFA kombiniert mit FAM Modell |
||||||||||
KM 7 |
2 |
4 |
5698 |
45 |
9 |
45 |
33 |
13 |
9 |
|
KM 8 |
2 |
4 |
5329 |
55 |
9 |
47 |
28 |
8 |
17 |
|
Anmerkung. D = Klassendimensionen, G = Subgruppen, BIC = Bayesian Informationskriteriumswerte, nP = Anzahl zu schätzender Parameter, %MK = Prozentsatz eventuell missklassifizierter Befragter, C1 C5 = Prozentsatz Befragter in Subklassen
Die Prüfung eines LCFA Modells mit zwei unkorrelierten binären Faktoren (KM 6; Vgl. Tabelle 3), d.h. die Prüfung der Annahme von vier Subgruppen, die auf zwei binären Dimensionen angeordnet sind, passt nach dem BIC besser zu den Daten als KM 4. Auch der Klassifikationsfehler ist nach KM 6 mit 4% für den ersten binären Faktor deutlich niedriger als der für die Modelle 3 bis 5. Er beträgt für den zweiten Faktor jedoch 13%, woraus sich ein mittlerer Klassifikationsfehler von 9% für dieses Modell ergibt.
a) Charakterisierung der binären Klassenfaktoren: Die Kovarianzen der Symptombelastungsitems werden systematisch nur durch den ersten Faktor beeinflusst, der auch die Antworten zu den Gesundheitssorgenitems 1 und 12 am stärksten beeinflusst (Tabelle 4).
Linear approximierte standardisierte Faktor-Indikator Assoziationen nach LCFA (KM6) und kombinierten LCFA und FAM Modellen (KM7) ohne sowie mit Berücksichtigung von Kovariateneffekten und Residuenkorrelationen (KM8; N = 581)
|
|
KM6 |
KM7 |
KM8 |
KM6 |
KM7 |
KM8 |
KM7 |
KM8 |
2 |
Vielzahl Schmerzen |
.54 |
.56 |
.38 |
-.10 |
-.10 |
.05 |
.00* |
.00* |
5 |
Symptome Krankheit |
.41 |
.41 |
.39 |
.08 |
.07 |
.02 |
.00* |
.00* |
8 |
Vielzahl Symptome |
.62 |
.61 |
.34 |
-.07 |
-.06 |
.05 |
.00* |
.00* |
13 |
Körper nicht o.k. |
.48 |
.47 |
.45 |
-.06 |
-.06 |
-.00 |
.00* |
.00* |
1 |
Sorgen ernsthaft krank |
.44 |
.44 |
.55 |
.38 |
.34 |
.25 |
.00* |
.00* |
4 |
Viele Sorgen Gesundheit |
.46 |
.46 |
.43 |
.44 |
.45 |
.35 |
.00* |
.00* |
12 |
Mehr Sorgen als andere |
.48 |
.47 |
.40 |
.24 |
.23 |
.13 |
.00* |
.00* |
6 |
Angst Krankheit bekommen |
.29 |
.28 |
18 |
.50 |
.49 |
.57 |
.00* |
.00* |
14 |
Angst krank werden |
.29 |
.28 |
.19 |
.51 |
.52 |
.52 |
.00* |
.00* |
7 |
Besser aussehen: ärgert das |
.09 |
.08 |
.04 |
.16 |
.14 |
.07 |
.27 |
.25 |
9 |
Nicht Ablenken |
.13 |
.12 |
.04 |
.08 |
.06 |
.17 |
.26 |
.24 |
10 |
Arzt nicht glauben |
.20 |
.11 |
.21 |
.13 |
.11 |
.07 |
.28 |
.22 |
11 |
Krankheit wird nicht ernst genommen |
.25 |
.23 |
.20 |
.19 |
.18 |
.12 |
.36 |
.32 |
Anmerkung. * = auf Null fixierte Faktor-Klassenindikatoren Assoziationen
Die Items zu Bedrohung durch Krankheit bzw. Erkrankungsfurcht (6 und 14) sind dagegen deutlich stärker mit dem zweiten Faktor assoziiert. Krankheitsangstitem 4 korreliert mit beiden binären Faktoren in etwa gleich hoch und jeweils substanziell. Der erste Faktor kann somit als Symptombelastung und Gesundheitssorgen interpretiert werden, der zweite als Bedrohung durch Krankheit bzw. als Erkrankungsfurcht ohne Symptombelastung.
Obwohl die Antworten zu den Items 10 und 11 nur bzw. stärker durch den ersten als durch den zweiten Faktor beeinflusst werden, sind alle Krankheitsüberzeugungsitems mit beiden binären Faktoren nicht oder nur sehr schwach substanziell korreliert. Wie danach zu erwarten, korrelieren ihre Residuen signifikant und teilweise relativ hoch. Deshalb wurde in KM 6 zusätzlich ein kontinuierlicher Faktor zur Aufklärung spezifischer Einflüsse auf ihre Beantwortung aufgenommen (KM 7; vgl. Tabelle 3). Dadurch verbessert sich die Passung der durch KM 6 identifizierten Klassenlösung deutlich, bei vergleichbarem Klassifikationsfehler und zufriedenstellend aufgeklärten Kovarianzen auch der Krankheitsüberzeugungsitems.
b) Klassenspezifische Symptomprofile: Zwei der vier durch Kreuzklassifizierung der beiden binären Klassenvariablen gebildeten Subgruppen (SB-KS- bzw. SB+KS+; vgl. Abbildung 2) unterscheiden sich nur durch eine durchgängig niedrige bzw. überdurchschnittlich hohe Bejahungswahrscheinlichkeit (vgl. Tabelle 5) für alle WI-d Items. Sie werden deshalb im Folgenden als somatoform allgemein belastet vs. nicht belastet bezeichnet.
Abbildung 2. Symptomprofile für vier Subklassen nach den Antworten zu den WI-d Items
Konditionale Bejahungswahrscheinlichkeiten (%) für die WI Items und Klassengrößen (%) nach den Modellen KM7 und KM8 für vier WI Subklassen (N = 581) somatoform nicht belastet (1), Symptombelastung / Gesundheitssorgen (2), Krankheitsfurcht (3) und somatoform allgemein belastet (4)
|
|
1 |
2 |
3 |
4 |
||||
|
|
KM7 |
KM8 |
KM7 |
KM8 |
KM7 |
KM8 |
KM7 |
KM8 |
|
|
45 |
47 |
13 |
8 |
33 |
28 |
9 |
17 |
Symptombelastung |
|
|
|
|
|
|
|
|
|
2 |
Vielzahl Schmerzen |
1 |
2 |
48 |
23 |
0 |
3 |
24 |
29 |
5 |
Symptome Krankheit |
4 |
4 |
31 |
31 |
7 |
5 |
45 |
36 |
8 |
Vielzahl Symptome |
2 |
5 |
59 |
27 |
1 |
7 |
41 |
29 |
13 |
Körper nicht o.k. |
1 |
1 |
38 |
29 |
1 |
1 |
26 |
25 |
Krankheitsangst |
|
|
|
|
|
|
|
|
|
1 |
Sorgen ernsthaft krank |
1 |
2 |
26 |
29 |
24 |
13 |
90 |
78 |
4 |
Viele Sorgen Gesundheit |
2 |
5 |
44 |
33 |
28 |
30 |
97 |
84 |
6 |
Angst Krankheit bekommen |
5 |
3 |
30 |
10 |
48 |
51 |
88 |
78 |
12 |
Mehr Sorgen als andere |
1 |
1 |
15 |
15 |
5 |
4 |
64 |
39 |
14 |
Angst krank werden |
10 |
12 |
47 |
31 |
63 |
62 |
93 |
85 |
Krankheitsüberzeugung |
|
|
|
|
|
|
|
|
|
7 |
Besser aussehen: ärgert das |
6 |
9 |
11 |
11 |
15 |
13 |
23 |
16 |
9 |
Ablenken können |
6 |
4 |
13 |
6 |
9 |
14 |
19 |
17 |
10 |
Arzt nicht glauben |
4 |
4 |
13 |
14 |
9 |
7 |
27 |
22 |
11 |
Krankheit wird nicht ernst genommen |
5 |
6 |
20 |
18 |
15 |
13 |
41 |
32 |
In zwei weiteren Subgruppen (SB+KF- bzw. SB-KF+; vgl. Abbildung 2) werden entweder die mit dem Symptombelastung/Gesundheitssorgen Faktor assoziierten WI-d Items mit vergleichsweise hoher Wahrscheinlichkeit bejaht oder aber insbesondere die beiden prominenten Items (6 und 14) des Erkrankungsfurchtfaktors, die jeweils mit der anderen Klassenvariable korrelierten Items aber eher verneint. Eine Subgruppe mit prominenter Symptombelastung und moderaten Gesundheitssorgen wird also von einer Subgruppe mit prominenter Erkrankungsfurcht bei fehlender Symptombelastung unterschieden. Die mit beiden Faktoren nicht oder nur schwach assoziierten Krankheitsüberzeugungsitems (vgl. Tabelle 4) tragen nur wenig zur qualitativen Differenzierung der Subgruppen bei. Sie werden jedoch am seltensten in der nicht belasteten und am häufigsten in der allgemein belasteten Subgruppe bejaht. Ihre Zustimmungswahrscheinlichkeiten und damit eine durch diese nahe gelegte Tendenz zu hypochondrischen Überzeugungen sind jedoch auch in der Subgruppe Symptombelastung mit Gesundheitssorgen relativ hoch, nicht aber in der Subgruppe
Erkrankungsfurcht. Auch diese inhaltlich und statistisch akzeptable Klassenlösung erklärt jedoch die Kovarianzen aller Antworten noch nicht hinreichend, ersichtlich aus signifikant assoziierten Residuen der Items 8 und 2 (.22), 13 und 2 (.23) sowie 12 und 14 (.19). Die Items zur Krankheitsüberzeugung, die sich nach den nichtlinearen Faktorenanalysen einer dritten Dimension zuordnen, beeinflusste die Klassenbildung zudem nur marginal. Dies könnte zwar an ihrer im Vergleich zu den beiden anderen Konstrukten mangelhaften formalen Validität liegen. Sie legt nahe, dass ihre Beantwortung zusätzlich durch weitere, nicht systematisch erfasste Faktoren mit beeinflusst wird, wie z.B. allgemeines Vertrauen in das Gesundheitssystem oder unterschiedlichen Haltungen gegenüber Krankheitsgewinn. Alternativ könnte ihr geringer Einfluss auf die Differenzierung klassenspezifischer Symptomprofile jedoch auch darauf zurückzuführen sein, dass hypochondrische Probanden bereits durch starke Ausprägungen auf den diskreten Klassenfaktoren Erkrankungsfurcht und Symptombelastung / Gesundheitssorgen so gut identifiziert werden, dass das dritte Konstrukt redundant für die Klassenbildung ist und deshalb scheinbar nichts zu dieser beiträgt.
Itemkennwerte
Wie nach den Daten von Pilowsky und insbesondere für relativ junge Befragte zu erwarten, gehören alle Krankheitsüberzeugungsitems mit zu den schwierigsten, gefolgt von den Symptombelastungsitems. Deutlich leichter sind die Items zu Gesundheitssorgen und Krankheitsangst. Dies gilt nicht nur nach den Daten (vgl. Tabelle 1) aus der Erhebung in 2005, sondern auch nach den Daten aus den Erhebungen in 2003 (N = 908) und 2004 (N = 731). Item 14 wurde in unseren Stichproben jedoch eventuell zusätzlich auch deshalb so häufig bejaht, weil es aufgrund einer unzulänglichen Übersetzung nicht nur irrationale Angst vor Krankheiten indizieren kann, sondern auch eine funktionale und berechtigte Angst davor, krank zu werden (are you afraid of illness; haben Sie Angst davor, krank zu werden).
Die ermittelten Dimensions- und Klassenlösungen sind zwar jeweils inhaltlich und statistisch zufriedenstellend. Nach den Faktor-Indikator Assoziationen aus IRT Normalogivenanalysen (vgl. Abbildung 1) Modellen sind jedoch insbesondere die Items zur Gesundheitsüberzeugung zum Teil nicht hinreichend formal valide bzw. reliabel. Bedingte lokale stochastische Unabhängigkeit und Einfachstruktur der WI-d Itembeantwortungen gilt zudem nach beiden methodischen Ansätzen nur partiell, offensichtlich auch aufgrund funktionaler Zusammenhänge zwischen den erfragten Sachverhalten. Dies könnte erklären, dass einzelne Items auch nach vorausgegangenen Studien entweder zu wenig trennscharf waren oder sich anderen WI-d Subdimensionen zuordneten. Einzelne Itemformulierungen des WI-d sind ferner erkennbar verbesserungsbedürftig. Differenziertere Ergebnisse sowohl zu Dimensionen als auch zu Klassen wären möglich, wenn mehr, und eindeutiger insbesondere die Konstrukte Gesundheitssorgen und Krankheitsangst indizierende Items einbezogen würden.
Reliabilität
Nach den Faktor-Indikator Assoziationen aus IRT Normalogivenanalysen (vgl. Abbildung 1) und LCFA Modellen (vgl. Tabelle 4) sind insbesondere die Items zur Gesundheitsüberzeugung zum Teil nicht hinreichend formal valide bzw. reliabel. Bedingte lokale stochastische Unabhängigkeit und Einfachstruktur der WI-d Itembeantwortungen gilt zudem nach beiden methodischen Ansätzen nur partiell.
Validität
WI-d Dimensionen:
a) In eine erweiterte Messmodellanalyse wurden zunächst zusätzlich zu den WI-d Messmodellen die Messmodelle für die zwei sehr ähnlichen Konstrukte Gesundheitssorgen und Krankheitsangst nach dem MK-HAI einbezogen. Ihre geschätzten Korrelationen mit Krankheitsangst nach dem WI-d sind sehr hoch (.88 bzw. .90). Die entsprechenden WI-d Items erfassen also wie intendiert Gesundheitssorgen und Krankheitsangst. Sie differenzieren diese Facetten aber anders als der MK-HAI nicht ausreichend, u.a. wegen zu weniger Items. Sie setzen zudem nicht nur Gesundheit, sondern auch Krankheit jeweils mit Sorgen in Beziehung statt mit Angst wie der MK-HAI.
b) Die Validität der WI-d Subdimensionen wird weiterführend durch eine Strukturmodellanalyse belegt, aus der die MK-HAI Items zu Krankheitsangst und Gesundheitssorgen wegen ihrer hohen Redundanz mit der entsprechenden WI-d Dimension ausgeschlossen wurden (Abbildung 3).
Abbildung 3
Beziehung der WI-d Subdimensionen zu anderen Konstrukten; c2 = 698.5, df = 339, 581; CFI = .93; TLI = .95; RMSEA = .04; (aus Gründen der Übersicht: nur signifikante direkte Regressionspfade; keine Einzelindikatoren, Residuenkorrelationen sowie direkte Effekte mehrerer Körperwahrnehmungen auf ihre Attribution)
Die wichtigsten Ergebnisse dieser Analyse sind: Den signifikanten direkten Effekten zufolge fördert mangelnde Gedankenkontrolle Körperaufmerksamkeit und Gesundheitssorgen, sowie Krankheitsüberzeugungen und Symptombelastung, wenn auch schwächer. Letztere wird auch durch die Häufigkeit tonischer Körperwahrnehmungen erhöht und fördert ihrerseits Krankheitsüberzeugungen. Je stärker zudem die durch Körperwahrnehmungen ausgelöste Angst ist, desto stärker ausgeprägt ist mangelnde Gedankenkontrolle. Psychische Attributionen verstärken durch Körperwahrnehmungen ausgelöste Angst, während ein somatischer Attributionsstil sie signifikant, wenn auch nur schwach reduziert. Ferner sind psychische Attributionen umso wahrscheinlicher, je stärker eine Sorgentendenz ist und je häufiger tonische Körperwahrnehmungen erlebt werden. Diese fördern auch somatische Attributionen. Situative Attributionen nehmen mit der Häufigkeit phasischer Körperwahrnehmungen zu. Nach einer Prüfung indirekter Effekte erhöhen psychische und somatische Attributionstendenzen sowie eine Sorgentendenz signifikant - vermittelt über Angstsensitivität - die Symptombelastung. Ein psychischer Attributionsstil und über diesen vermittelt tonische Körperwahrnehmungen verstärken zusätzlich Krankheitsangst. Alle weiteren möglichen indirekten Effekte werden durch die direkten Effekte absorbiert.
WI-d Subgruppen: Zeigen die beiden binären Klassenvariablen ähnliche Zusammenhänge zu anderen Konstrukten wie die im vorigen Abschnitt beschriebenen drei WI-d Subdimensionen? Zur Beantwortung dieser Frage wurden die Antwortsummenwerte der dort berücksichtigten eindimensionalen Konstrukte in eine weiterführende Prüfung von KM 7 als Kovariate einbezogen (KM 8), mit Ausnahme der nicht mit den WI-d Dimensionen korrelierten situativen Attributionen und Häufigkeiten phasischer Körperwahrnehmungen. Die wichtigsten Ergebnisse der Analyse des so erweiterten Modells KM 8 (vgl. Tabelle 3), das nochmals deutlich besser passt, sind: Nach signifikanten multinominalen Regressionskoeffizienten erhöhen eine Sorgentendenz (.62) und mangelnde Gedankenkontrolle (1.74) die Zustimmungswahrscheinlichkeiten für alle mit der binären Klassenvariable Symptombelastung/Gesundheitssorgen assoziierten Items. Die Zustimmung zu den durch die binäre Klassenvariable Erkrankungsfurcht beeinflussten Items ist dagegen umso wahrscheinlicher, je ausgeprägter Angstsensitivität (.78), eine Tendenz zu somatischen Attributionen (.74), sowie Körperaufmerksamkeit (.79) und mangelnde Gedankenkontrolle (1.31) sind. Neben diesen indirekten, d.h. über die binären Faktoren vermittelten Beeinflussungen der Antwortwahrscheinlichkeiten, fördern häufige tonische Körperwahrnehmungen direkt die Bejahung von drei der Items zur Symptombelastung: Symptome einer ernsten Krankheit bei sich feststellen (Item 5, 1.09), eine Vielzahl von Symptomen (Item 8, 2.04) und der Glaube, eine ernsthafte Krankheit zu haben (Item 13, 2.04). Item 13 wird jedoch umso seltener zugestimmt, je stärker eine allgemeine Sorgentendenz ist (-1.17). Diese zunächst paradox erscheinende Beobachtung ist jedoch plausibel so zu erklären: Befragte, die körperlich krank sind und sich darüber sorgen, könnten dieses Item verneinen, eben weil sie nicht glauben, krank zu sein, sondern sich dessen gewiss sind. Item 12 (Mehr Sorgen als andere, 1.01) wird zudem umso wahrscheinlicher bejaht, je stärker die Körperaufmerksamkeit ist. Die Tendenz, Körperwahrnehmungen psychisch zu attribuieren, beeinflusst dagegen nach KM 8 die Antwortwahrscheinlichkeiten weder indirekt noch direkt. Eine sequenzielle Einbeziehung von Kovariaten zeigt jedoch, dass der Einfluss einer solchen Tendenz durch die Effekte häufiger tonischer Wahrnehmungen und durch Angstsensitivität absorbiert wird.
Kovariateneinflüsse auf kontinuierliche Faktoren können mit LatentGold nicht ermittelt werden. Nach den durch KM 8 ermittelten direkten Effekten werden die drei Krankheitsüberzeugungsitems 7 (Besser Aussehen - ärgert das, .93), 10 (Arzt nicht glauben, 1.10) und 11 (Krankheit wird nicht ernst genommen, 1.10) jedoch umso wahrscheinlicher als richtig akzeptiert, je stärker die Angstsensitivität ist. Die Bejahungswahrscheinlichkeit für Item 9 (Nicht an sich selbst denken, .63) wird durch eine Sorgentendenz erhöht und die für Item 11 zusätzlich durch Körperaufmerksamkeit (.65).
Die zusätzliche Konditionierung klassenspezifischer Antwortprofile auf unterschiedliche Ausprägungen verwandter Konstrukte führt dazu (vgl. Tabelle 5), dass mehr Befragte der allgemein belasteten Subgruppe und weniger Befragte den beiden Subgruppen mit differenziellen Antwortprofilen zugeordnet werden. Verantwortlich ist dafür vor allem, dass die Bejahung der Items 8 und 2 (Vielzahl Schmerzen sowie Symptome) sowie die von Item 1 (Sorgen, ernsthafte Krankheit zu haben) nach KM 8 mit einer gegenüber KM 7 modifizierten Gewichtung in die Bestimmung der subgruppenspezifischen Antwortprofile eingehen. Die beiden ersten Items werden direkt durch die Häufigkeit tonischer Wahrnehmungen beeinflusst bzw. durch eine Tendenz, solche als Krankheitssymptome zu interpretieren. Nach KM 8 sind sie beide deutlich schwächer mit der binären Klassenvariablen Symptombelastung/Gesundheitssorgen assoziiert als nach KM 7, das Krankheitsangstitem 1 aber stärker, und zudem deutlich stärker als mit der zweiten Klassenvariablen. Diese korreliert demgegenüber nach KM 8 vergleichbar oder stärker mit ihren wesentlichen Items 6 und 14. Die Items 8 und 2 trennen nach KM 8 also weniger gut als nach KM 7 zwischen Befragten mit einer niedrigen vs. hohen Ausprägung auf der ersten Klassenvariablen, d.h. Befragte auf der niedrigen vs. hohen Ausprägungsstufe dieser Variablen unterscheiden sich weniger stark in der Zustimmung zu diesen Items. Werden sie bejaht, erhöht sich nach KM 8 nicht nur wie nach KM 7 die Wahrscheinlichkeit, der Subklasse Symptombelastung/Gesundheitssorgen anzugehören, sondern vergleichbar oder stärker auch die Wahrscheinlichkeit, in die allgemein somatoform belastete Subgruppe zu fallen. Das Umgekehrte gilt für Item 1: Seine Bejahung erhöht nach KM 8 stärker als nach KM 7 die Wahrscheinlichkeit, der ersten statt der zweiten dieser Subgruppen anzugehören. Nach KM 8 ist zudem die Bejahung der Items 8, 4, 14 oder 7 auch durch Angehörige der nicht belasteten Subgruppe jeweils etwas wahrscheinlicher als nach KM 7. Gleichermaßen nach beiden Modellen ist aber die Wahrscheinlichkeit der Bejahung von Item 14 auch in dieser Subgruppe relativ hoch. D.h., beide Klassenmodelle eignen sich offensichtlich aufgrund der Berücksichtigung der Bejahung der übrigen Items dazu, zwischen Befragten zu differenzieren, die nachvollziehbar Angst haben, krank zu werden, oder aber irrationale Angst vor Krankheiten als Merkmal einer somatoformen Beeinträchtigung.
Dass die vier Subgruppen inhaltlich plausible, unterschiedliche Ausprägungen somatoformer Beeinträchtigungen reflektieren, wird durch weitere Beobachtungen (vgl. Tabelle 6) belegt: Die Antwortsummenmittelwerte für alle zur Validierung verwendeten Konstrukte sind jeweils in der nicht belasteten Subgruppe am niedrigsten und in der allgemein belasteten am höchsten. Wie nach den Kovariateneffekten zu erwarten, unterscheiden sich jedoch die Mittelwerte für somatische und psychische Attributionstendenzen in der nicht belasteten und der belasteten Subgruppe nur wenig.
Summenwerte für den WI und Mittelwerte für verwandte Konstrukte für vier WI Subklassen (N = 581) somatoform nicht belastet (1), Symptombelastung / Gesundheitssorgen (2), Krankheitsfurcht (3) und somatoform allgemein belastet (4)
|
1 |
2 |
3 |
4 |
|
WI |
WI |
WI |
WI |
0 |
35 |
4 |
3 |
0 |
1 |
41 |
7 |
15 |
0 |
2 |
17 |
13 |
28 |
1 |
3 |
5 |
24 |
27 |
9 |
4 |
2 |
21 |
18 |
11 |
5 |
0 |
15 |
8 |
16 |
6 |
0 |
13 |
1 |
22 |
7 |
0 |
2 |
0 |
18 |
8 |
0 |
1 |
0 |
10 |
9-13 |
0 |
0 |
0 |
14 |
PSWQ |
2.4 |
2.9 |
2.7 |
3.2 |
ASI |
0.9 |
1.1 |
1.4 |
1.7 |
SOM |
0.7 |
0.8 |
0.8 |
0.9 |
PSY |
1.1 |
1.3 |
1.4 |
1.5 |
TON |
1.2 |
1.5 |
1.4 |
1.6 |
AU |
1.5 |
1.9 |
2.2 |
2.5 |
GK |
0.3 |
0.8 |
0.8 |
1.7 |
GS |
0.5 |
1.7 |
1.0 |
2.1 |
KA |
0.3 |
1.0 |
1.0 |
2.2 |
Anmerkung. () = Prozentsatz von Befragten pro Subklasse, WI = WI Summenwerte, PSWQ = Mittelwerte Sorgentendenz, ASI = Mittelwerte Angstsensitivität, SOM = Mittelwerte somatische Attributionstendenzen (SIQ), PSY = Mittelwerte psychische Attributionstendenzen (SIQ), TON = Mittelwerte Häufigkeit tonischer Körperwahrnehmungen (SIQ), AU = Mittelwerte Körperaufmerksamkeit (MK-HAI), GK = Mittelwerte Gedankenkontrolle (MK-HAI), GS = Mittelwerte Gesundheitssorgen (MK-HAI), KA = Mittelwerte Krankheitsangst (MK-HAI)
Die beiden Subgruppen mit differenziellen Symptomprofilen unterscheiden sich in der Angstsensitivität, sowie hinsichtlich Gesundheitssorgen und Körperaufmerksamkeit nach dem MK-HAI: Körperaufmerksamkeit und Angstsensitivität sind stärker ausgeprägt in der Subgruppe Erkrankungsfurcht, Gesundheitssorgen in der Subgruppe Symptombelastung/Gesundheitssorgen.
Über die vier Subgruppen ansteigende Summenwerte für den WI-d (vgl. Tabelle 6) bestätigen ebenfalls die Validität der Klassenlösung nach KM 8. Bei Verwendung des üblichen Cut off Werts von 8 zur Ermittlung von Personen mit einem Risiko für klinisch bedeutsame Hypochondrie würden 24% der allgemein belasteten Gruppe erfasst, 1% der Gruppe Symptombelastung / Gesundheitssorgen, aber niemand aus der nicht belasteten Gruppe oder der Erkrankungsfurchtgruppe. Nur 4.4% unserer Befragten erreichten einen WI-d Summenwert von mindestens 8, aber fast alle von ihnen (4%) werden der allgemein belasteten Klasse zugeordnet. Erst bei entsprechender Ausprägung beider klassenbildender Variablen werden also klinisch relevante Summenwerte im WI-d erreicht.
Ein Vergleich der Dimensions- und Klassenlösung ist für theoretische Modelle der Hypochondrie aufschlussreich. Die Dimensionsanalyse grenzte die Konstrukte Symptombelastung, Krankheitsangst und Krankheitsüberzeugung voneinander ab und nach der Klassenanalyse waren Modelle mit nur nominal geordneten vier Klassen solchen mit entlang von zwei binären Faktoren geordneten unterlegen. Diese Ergebnisse sprechen gegen die Annahme, Hypochondrie sei ein Pol einer Dimension Krankheitsangst (vgl. Williams, 2004). Sie bestätigen jedoch klinische Bedingungsmodelle der Hypochondrie (vgl. Salkovskis et al., 2002), nach denen ängstliche Bewertung wahrgenommener Veränderungen körperlicher Funktionen über erhöhte Körperaufmerksamkeit wiederum die Symptomwahrnehmung intensiviert. Überschreiten diese Prozesse ein kritisches Ausmaß, so steigt das Risiko für die Ausbildung hypochondrischer Überzeugungen sprunghaft an. Diesen Überlegungen entspricht unsere Klassenlösung, die der allgemein belasteten somatoformen Klasse fast alle Probanden mit Whiteley-d Summenwerten 8 zuteilt. Allerdings bleiben die Summenwerte von 76% der Probanden in dieser Klasse unter dem Wert von 8. Die Klasse erfasst also mehrheitlich Probanden aus dem subklinischen Bereich von Erkrankungsfurcht und Symptombelastung / Gesundheitssorgen. Aber auch dieser Befund ist gut vereinbar mit klinischen Bedingungsmodellen zur Entstehung der hypochondrischen Störung, nach denen hohe Werte von Erkrankungsangst und Symptombelastung / Gesundheitssorgen hypochondrische Überzeugungen nur bei Vorliegen weiterer, hier nicht erfasster personaler Vulnerabilitätsfaktoren (z.B. Neurotizismus; vgl. Williams, 2004) bewirken. Auch nach der LCA von Hypochondriekriterien durch Fink et al. (2004), erfüllte eine erheblich größere Gruppe von Probanden niederschwellige Hypochondriekriterien als die strengen Kriterien des DSM.
Deskriptive Statistiken
Wie nach den Daten von Pilowsky und insbesondere für relativ junge Befragte zu erwarten, gehören alle Krankheitsüberzeugungsitems mit zu den schwierigsten, gefolgt von den Symptombelastungsitems. Deutlich leichter sind die Items zu Gesundheitssorgen und Krankheitsangst. Dies gilt nicht nur nach den Daten (vgl. Tabelle 1) aus der Erhebung in 2005, sondern auch nach den Daten aus den Erhebungen in 2003 (N = 908) und 2004 (N = 731). Item 14 wurde in unseren Stichproben jedoch eventuell zusätzlich auch deshalb so häufig bejaht, weil es aufgrund einer unzulänglichen Übersetzung nicht nur irrationale Angst vor Krankheiten indizieren kann, sondern auch eine funktionale und berechtigte Angst davor, krank zu werden (are you afraid of illness; haben Sie Angst davor, krank zu werden).