Instruktion
Die folgenden Aussagen können auf Sie selbst mehr oder weniger zutreffen. Bitte geben Sie bei jeder Aussage an, wie sehr die Aussage auf Sie zutrifft.
Items
Die KSE-G erfasst zwei Aspekte des Gamma-Faktors von Soziale Erwünschtheit, die Übertreibung positiver Qualitäten (PQ+) und die Minimierung negativer Qualitäten (NQ-) mit jeweils drei Items.
Nr. |
Item (deutsch) |
Items (englisch) |
Kurzskala |
1 |
Im Streit bleibe ich stets sachlich und objektiv. |
In an argument, I always remain objective and stick to the facts. |
PQ+ |
2 |
Auch wenn ich selbst gestresst bin, behandle ich andere immer freundlich und zuvorkommend. |
Even if I am feeling stressed, I am always friendly and polite to others. |
PQ+ |
3 |
Wenn ich mich mit jemandem unterhalte, höre ich ihm immer aufmerksam zu. |
When talking to someone I always listen carefully to what the other person says. |
PQ+ |
4 |
Es ist schon mal vorgekommen, dass ich jemanden ausgenutzt habe. |
It has happened that I have taken advantage of someone in the past. |
NQ- |
5 |
Ich habe schon mal Müll einfach in die Landschaft oder auf die Straße geworfen. |
I have occasionally thrown litter away in the countryside or on to the road. |
NQ- |
6 |
Manchmal helfe ich jemandem nur, wenn ich eine Gegenleistung erwarten kann. |
Sometimes I only help people if I expect to get something in return. |
NQ- |
Antwortvorgaben
Für die Antworten der Befragungsperson steht eine fünfstufige Ratingskala zur Verfügung. Die Antwortkategorien der KSE-G gehen von „trifft gar nicht zu“ (0) bis „trifft voll und ganz zu“ (4).
Auswertungshinweise
Um einen Messwert (Skalenwert) für die individuelle Ausprägung der Befragungsperson in PQ+ bzw. NQ- zu erhalten, werden deren Antworten auf den drei Items der jeweiligen Skala aggregiert: Die drei Items werden zunächst summiert und anschließend durch die Anzahl der Items pro Skala geteilt. Der Wertebereich für PQ+ und NQ- liegt zwischen 0 und 4 (für Referenzwerte siehe Tabelle 6 und in Tabelle 7).
Anwendungsbereich
Die KSE-G wurde als Forschungsinstrument für sozialwissenschaftliche Untersuchungen unterschiedlichster Art und Fragestellung entwickelt. Als Zielgruppe wurde daher die deutschsprachige Allgemeinbevölkerung ab 18 Jahren gewählt. Ausgenommen sind Personen, deren sprachliche oder kognitive Fähigkeiten oder deren Wahrnehmungsfähigkeiten, z. B. durch Seh- oder Hörschwäche, unzureichend sind, um die Items zu verstehen. Die Itemformulierungen wurden in einem Expertenreview für die Zielgruppe optimiert. Auch die berichteten empirisch ermittelten Gütekriterien beziehen sich auf diese Zielgruppe.
Die KSE-G kann prinzipiell in unterschiedlichen Erhebungsmodi eingesetzt werden. Im Rahmen unserer Validierung haben wir die Skala im CASI-Modus (Computer Assisted Self Interview) und im CAWI-Modus (Computer Assisted Web Interview) eingesetzt. Vor einem Einsatz der KSE-G in Mixed-Mode-Designs sollte allerdings eine Prüfung der Invarianz erfolgen.
Die Durchführungszeit einer Vorversion der KSE-G mit acht Items im CASI-Modus liegt zwischen einer und eineinhalb Minuten. In 75% der CASI-Interviews dauert die Durchführung mit der Acht-Item-Version 83 Sekunden oder weniger (Perzentil75 = 83). Eine ähnliche Durchführungsdauer ist im CAWI-Modus zu erwarten. Für die finale Sechs-Items-Version der KSE-G liegt die Durchführungsdauer noch unterhalb dieser Angaben.
Seit mehr als 50 Jahren wird das Konstrukt Soziale Erwünschtheit in der psychologischen Forschung untersucht (Crowne & Marlowe, 1960; Edwards, 1957; Paulhus, 1991, 2002). Am weitesten verbreitet ist die Konstruktdefinition von Paulhus (2002) nach der soziale Erwünschtheit als Tendenz verstanden wird überwiegend positive Beschreibungen der eigenen Person abzugeben („tendency to give overly positive self-descriptions“, S. 50). Soziale Erwünschtheit hat weitreichende Implikationen für die Messung von Persönlichkeitsmerkmalen oder Einstellungen über Fragebögen oder Interviews (Selbstberichte). Auf der Verhaltensebene schlägt sich Soziale Erwünschtheit in Antwortverzerrungen (response bias) nieder, die beispielsweise zu einer Konfundierung von statistischen Zusammenhängen zwischen Untersuchungsvariablen führen können. In den vergangenen Dekaden wurden zahlreiche Studien durchgeführt, um die Struktur des Konstrukts zu untersuchen, geeignete Messinstrumente zu konstruieren und diese mit dem Ziel der statistischen Kontrolle der Konfundierung einzusetzen (für eine Übersicht solcher Arbeiten siehe zum Beispiel Paulhus, 1991, 2002).
Verschiedene Modelle zur Strukturierung des Konstrukts wurden während der letzten Jahre vorgeschlagen (für eine Übersicht siehe Paulhus, 2002). Paulhus präsentiert das bislang umfassendste Modell, das als Synthese aus bisherigen empirischen Befunden und konzeptuellen Überlegungen angesehen werden kann. Er schlägt ein mehrdimensionales Modell des Konstrukts Soziale Erwünschtheit vor. Auf der obersten Ebene der hierarchischen Struktur sind zwei abstrakte Faktoren angeordnet: Alpha und Gamma. Gemeinsam ist diesen Faktoren, dass sie sowohl einen Selbsttäuschungsstil als auch einen Fremdtäuschungsstil beinhalten. Allerdings sollen sich die Faktoren Alpha und Gamma im Hinblick auf ihre Inhalte unterscheiden. Nach Paulhus gehen Unterschiede in den beiden Faktoren auf zwei zugrunde liegende Werte zurück: Agency (Selbstbehauptung, Selbstschutz, Selbstentfaltung, Abgrenzung von anderen, Streben nach Macht und Kontrolle) und Communion (Gemeinsinn, Verbundenheit, Offenheit für die Gefühle anderer, Streben nach Gemeinschaft, Teilnahme, Kooperation und Bindung; vgl. Bakan, 1966). Wenn Personen Agency-Werte stark internalisiert haben, dann zeigen sie laut Paulhus einen egoistischen Bias (mit Alpha assoziiert). Diese Personen neigen dazu ihren sozialen und intellektuellen Status zu übertreiben. Sie geben unrealistisch positive Selbstbeschreibungen zu Persönlichkeitsmerkmalen ab, die mit Agency assoziiert sind, zum Beispiel zu Dominanz, Angstfreiheit, Intellekt und Kreativität. Neben diesen weitgehend unbewussten Prozessen (Selbsttäuschung), die sich in einem egoistischen Bias manifestieren können, nennt Paulhus auch bewusste Versuche der Eindruckssteuerung (Fremdtäuschung), zum Beispiel prahlen und angeben, die er als Agency-Management bezeichnet. Bei Personen, die Communion-Werte stark internalisiert haben, wird angenommen, dass sie einen moralistischen Bias zeigen (mit Gamma assoziiert). Diese Personen neigen dazu sozial unerwünschte Impulse zu leugnen und sich positive Attribute zuzuschreiben. Sie geben unrealistisch positive Selbstbeschreibungen zu Persönlichkeitsmerkmalen ab, die mit Communion assoziiert sind, zum Beispiel zu Verträglichkeit, Pflichtbewusstsein und Selbstbeherrschung. Auf Ebene der Fremdtäuschung sollen sie dazu neigen in Situationen, die ihre Communion-Werte ansprechen, schadensbegrenzendes Verhalten zu zeigen und Ausreden vorzubringen, um in einem besseren Licht zu erscheinen. Dieses von Paulhus vorgestellte Modell führt bisherige Ansätze überzeugend in einem integrativen Modell zusammen (für weitere Details siehe Paulhus, 2002). Die bisherigen Dichotomien wie Selbsttäuschung vs. Fremdtäuschung oder bewusstes vs. unbewusstes Verhalten wurden aufgelöst bzw. in die abstrakten Faktoren Alpha und Gamma integriert: Beide Faktoren sind mit einem Bias assoziiert, der sich aus internalisierten Werten speist und sowohl aufgrund von bewussten als auch unbewussten Prozessen in sozial erwünschtem (Antwort-)Verhalten manifestieren kann.
Für die Umfrageforschung ist insbesondere eine Messung des Gamma-Faktors der sozialen Erwünschtheit von Interesse. In der Umfrageforschung werden Daten primär per Face-to-Face-Interview erhoben. Diese besondere Interaktionssituation zwischen Interviewer und Befragungsperson regt Communion-Werte auf Seiten der Befragungsperson an. Weiterhin verweisen Interviewer in sozialwissenschaftlichen Umfragen, in Abgrenzung zu kommerziell motivierten Marktforschungsumfragen, nicht selten auf die gesellschaftliche Bedeutung der Umfrage, um die Teilnahmebereitschaft zu erhöhen. Bei der Befragungsperson könnte dies einen durch die Situation ohnehin induzierten moralistischen Bias weiter verstärken. Er könnte dazu führen, dass sich die Befragungsperson bemüht wie eine „nette Person“ oder ein „guter Bürger“ auf die Fragen zu antworten. Ihr Antwortverhalten wird dadurch verzerrt. Um diesen möglichen Einflussfaktor auf empirische Untersuchungsergebnisse ökonomisch quantifizieren zu können, wurde eine Kurzskala zur Erfassung des Gamma-Faktors der Sozialen Erwünschtheit (KSE-G) entwickelt und validiert.
Itemkonstruktion und Itemselektion
Um die Skala zu konstruieren wurde zunächst ein Pool von Items zusammengestellt, die gemäß dem Ansatz von Crowne und Marlowe (1960) gesellschaftlich gewünschte aber meist seltene Verhaltensweisen oder gesellschaftlich sanktionierte aber häufig auftretende Verhaltensweisen erfassen. Dazu wurden bestehende Skalen, zum Beispiel die Soziale-Erwünschtheits-Skala-17 (SES-17; Stöber, 1999) und die Social Desirability Scale von Crowne und Marlowe (SDS-CM; 1960) herangezogen und Items entnommen. Diese wurden in Expertenreviews sprachlich überarbeitet, um deren Verständlichkeit für die anvisierte Zielgruppe und die Inhaltsvalidität zu erhöhen. Anschließend wurde der Itempool in einer Serie von Studien quantitativ analysiert (Item- und Strukturanalysen) und Items wurden selegiert. Die Strukturanalysen ergaben eine zweifaktorielle Struktur mit zwei korrelierten Faktoren, die als „Übertreibung positiver Qualitäten“ und „Minimierung negativer Qualitäten“ interpretiert wurden (vgl. Roth, Snyder & Pace, 1986). In einem iterativen Prozess wurden psychometrisch ungeeignete Items (geringe Faktorladungen, geringe Varianz, hohe Schiefe etc.) ausgeschieden und neue Items entwickelt, hinzugefügt und der Pool erneut an einer Stichprobe geprüft. Ergebnis der mehrstufigen Itemselektion waren die sechs Items der KSE-G, die zwei unterschiedliche Aspekte des Gamma-Faktors des Konstrukts Soziale Erwünschtheit mit jeweils drei Items erfassen. Die KSE-G wurde anschließend in drei alters-, geschlechts-, und bildungsheterogenen Stichproben validiert. Im Folgenden werden diese Stichproben und die Umstände der Erhebung näher beschrieben. Die Charakteristika der Stichproben können Tabelle 1 entnommen werden.
Um die Nutzung der Skala für englischsprachige Untersuchungen zu ermöglichen, wurde diese ins Englische übersetzt. Die International Test Commission (2010) empfiehlt hierbei ein zweistufiges Verfahren. Zunächst übersetzten zwei hauptberufliche, muttersprachliche Übersetzer die Items unabhängig voneinander. Dabei wurde eine Übersetzung in britischem Englisch und die andere in amerikanischem Englisch angefertigt. In der zweiten Phase des Übersetzungsprozesses fand ein Rekonziliationstreffen statt, in dessen Verlauf die Übersetzungsvorschläge in einer Gruppe von Experten für die psychologischen Merkmale, den Übersetzern und einem weiteren Experten für Fragebogenübersetzung diskutiert und überarbeitet wurden. Die Güte der Übersetzungen wurde bislang allerdings noch nicht geprüft.
Stichproben
Stichprobe 1 ist eine Quotenstichprobe, geschichtet nach Geschlecht, Alter und Bildung (N = 741), die im Internet erhoben wurde (CAWI). Grundgesamtheit waren die Teilnehmer eines Online-Access-Pools im Alter von 18 Jahren oder älter, die in Deutschland leben. Der Onlinefragebogen enthielt, neben der KSE-G, einige soziodemographische Angaben und verschiedene Skalen zur Messung psychologischer Merkmale. Die Bearbeitung des Onlinefragebogens dauerte im Mittel 23 Minuten (SD = 8).
Stichprobe 2 mit N = 1134 Befragungspersonen ist eine Zufallsstichprobe, die repräsentativ für die Wohnbevölkerung in Deutschland über einem Alter von 18 Jahren ist. Sie wurde mithilfe des ADM-Stichprobensystem F2F (Random Route) der Arbeitsgemeinschaft deutscher Marktforschungsinstitute gezogen. Die Daten wurden im CAPI- und im CASI-Modus erhoben (Dauer: M = 43, SD = 13).
Bei Stichprobe 3 handelt es sich um eine anfallende Onlinestichprobe (CAWI). Studierende unterschiedlicher Fachbereiche der Humboldt-Universität zu Berlin wurden über eine E-Mail-Verteilerliste auf die Studie aufmerksam gemacht. Der Fragebogen enthielt einige soziodemographische Angaben, einen Leistungstest und zahlreiche deutsche Übersetzungen von Skalen zur Erfassung von sozial erwünschtem Antwortverhalten, zum Beispiel die SD-Skala von Edwards (Lück & Timaeus, 1969), das BIDR von Paulhus (Musch, Brockhaus & Bröder, 2002) und die Lügenskala (L-Skala) aus dem MMPI-2 (Hathaway, McKinley & Engel, 2000) sowie weitere psychologische Testverfahren. Die Bearbeitung des Onlinefragebogens dauerte im Mittel 40 Minuten (SD = 19).
Charakteristika der drei Validierungsstichproben
|
Stichprobe 1 |
Stichprobe 2 |
Stichprobe 3 |
Stichprobe |
|
||
Umfang [N] |
741 |
1134 |
939 |
Art |
Quote |
Zufall |
anfallend |
Modus |
CAWI |
CAPI/CASI |
CAWI |
Zusammensetzung |
|
||
Geschlecht [% Frauen] |
51.8% |
55.6% |
74.0% |
Alter [M (SD)] |
48.3 (13.0) |
53.3 (18.4) |
25.0 (5.4) |
Bildung ≤ 9 Jahre |
40.1% |
37.2% |
k.A. |
10 Jahre |
29.1% |
37.0% |
k.A. |
≥ 11 Jahre |
30.8% |
25.8% |
k.A. |
Anm.: CAPI = Computer Aided Personal Interview, CASI = Computer Assisted Self Interview, CAWI = Computer Aided Web Interview.
Durchführung
Die KSE-G wurde in zwei unterschiedlichen experimentellen Bedingungen vorgegeben (im CASI-Modus). Befragungspersonen wurden randomisiert auf die Bedingungen zugewiesen. In einer Bedingung wurde die übliche Instruktion verwendet; in der anderen wurde die Befragungsperson darauf aufmerksam gemacht, dass die Items der KSE-G Verhaltensweisen beschreiben, die zwar gerne gesehen, aber nicht häufig gezeigt werden bzw. nicht gerne gesehen, aber üblicherweise häufig gezeigt werden. Im Anschluss an diese Aufklärung wurde die Befragungsperson gebeten „auch jetzt wieder möglichst ehrlich“ zu antworten.
Variablen und Auswertungsmethode
Die Fragebogenbatterie beinhaltete neben der KSE-G (im CASI-Modus) umfangreiche soziodemographische Angaben, verschiedene psychologische Maße und einige sozialwissenschaftliche Validierungsmaße. Die Items zu den soziodemographischen Angaben wurden größtenteils den demographischen Standards des Statistischen Bundesamtes entnommen (2010). Für die Validierung kamen Standardinstrumente, zum Beispiel zur Erfassung der fünf Hauptdimensionen der Persönlichkeit nach dem Fünf-Faktoren-Modell (BFI-10, Rammstedt & John, 2007; Rammstedt, Kemper, Klein, Beierlein & Kovaleva, 2012) und Items zur Messung von Werten nach dem Modell von Schwartz (1992; Schwartz & Boehnke, 2004) und Items zur Erfassung von Devianz aus dem ALLBUS (im CASI-Modus; Allgemeine Bevölkerungsumfrage der Sozialwissenschaften) zum Einsatz.
Itemanalysen
Die KSE-G erfasst zwei Aspekte des Gamma-Faktors von sozialer Erwünschtheit, die Übertreibung positiver Qualitäten (PQ+) und die Minimierung negativer Qualitäten (NQ-) mit jeweils drei Items. Die Faktorstruktur der Skalen konnte bestätigt werden (siehe Validität).
Itemkennwerte
Die sechs Items der KSE-G und deren deskriptive Statistiken sind in Tabelle 2 dargestellt. Letztere basieren auf Daten einer umfangreichen, bevölkerungsrepräsentativen Zufallsstichprobe (Stichprobe 2, siehe Tabelle 1).
Items und deskriptive Statistiken der KSE-G aus Stichprobe 2
Nr. |
Item |
M |
SD |
Sch |
Kurt |
rit |
|
Subskala Übertreibung positiver Qualitäten (PQ+) |
2.66 |
.86 |
-.43 |
-.16 |
|
1 |
Im Streit bleibe ich stets sachlich und objektiv. |
2.55 |
1.01 |
-.41 |
-.34 |
.46 |
2 |
Auch wenn ich selbst gestresst bin, behandle ich andere immer freundlich und zuvorkommend. |
2.72 |
.99 |
-.57 |
-.13 |
.48 |
3 |
Wenn ich mich mit jemandem unterhalte, höre ich ihm immer aufmerksam zu. |
3.04 |
.87 |
-.98 |
1.30 |
.40 |
|
Subskala Untertreibung negativer Qualitäten (NQ-) |
3.24 |
.78 |
-1.04 |
.58 |
|
4 |
Es ist schon mal vorgekommen, dass ich jemanden ausgenutzt habe. |
.93 |
1.01 |
.96 |
.28 |
.50 |
5 |
Ich habe schon mal Müll einfach in die Landschaft oder auf die Straße geworfen. |
.59 |
1.00 |
1.77 |
2.39 |
.44 |
6 |
Manchmal helfe ich jemandem nur, wenn ich eine Gegenleistung erwarten kann. |
.76 |
.98 |
1.21 |
.75 |
.47 |
Anm.: Sch = Schiefe, Kurt = Kurtosis, N = 566
Objektivität
Unter Objektivität wird der Grad verstanden, in dem eine Messung unabhängig vom Untersucher ist (vgl. Lienert & Raatz, 1998). Diese bezieht sich auf verschiedene Phasen einer Untersuchung: Durchführung, Auswertung und Interpretation. Im Falle eines Face-to-Face-Interviews hängt die Durchführungsobjektivität von dem Interviewer ab, der die Daten erhebt. Sie ist gegeben, wenn dieser sich bei der Vorgabe der Skala an die genauen Instruktionen und den Wortlaut der Items hält. Bei entsprechend geschulten Interviewern ist die Durchführungsobjektivität üblicherweise gewährleistet (Rammstedt, 2010b). Auswertungsobjektivität betrifft die numerische und kategoriale Auswertung des Antwortverhaltens der Befragten nach festgelegten Regeln (vgl. Lienert & Raatz, 1998). Diese ist bei der KSE-G vollständig gegeben, da die Verrechnungsvorschriften der Werte auf den Items klar festgelegt sind und keinen Interpretationsspielraum zulassen. Interpretationsobjektivität ist gegeben, wenn die aus den Befragungsergebnissen gezogenen Schlüsse über verschiedene Forscher vergleichbar sind. Zur Maximierung der Interpretationsobjektivität sollte das Wissen der Forscher über die Messintention der Skala und über die Interpretation der quantitativen Messwerte vergleichbar sein (Rammstedt, 2010b). Durch die Normierung kann auch die Interpretationsobjektivität der KSE-G als gegeben angesehen werden.
Reliabilität
Unter der Reliabilität oder Messgenauigkeit einer Skala versteht man den Grad der Genauigkeit, mit dem ein bestimmtes Merkmal erfasst wird (vgl. Lienert & Raatz, 1998). Die Reliabilität der KSE-G wurde im Rahmen von Strukturgleichungsmodellen (SEM; Jöreskog, 1969) auf Grundlage der Ladungen und Fehlervarianzen aus den Messmodellen in den drei Stichproben geschätzt. Als Schätzer wurde der Koeffizient ω von McDonald (1999, S. 90) verwendet. Der Koeffizient gibt das Ausmaß an, in dem eine latente Variable (Konstrukt) von den Items geteilte Varianz reflektiert (Krohne & Hock, 2007). Laut Schweizer (2011) ist dieser Schätzer der Reliabilität besser geeignet als Cronbach α. Die Interpretation der Höhe von McDonald ω ist analog zu Cronbach α. Die Schätzer der Reliabilität für die beiden Skalen betragen in Stichprobe 2 ω = .71 für PQ+ und ω = .78 für NQ-. Dies entspricht einer für Gruppenuntersuchungen ausreichenden Reliabilität.
Eine Skala ist inhaltlich valide, wenn ein Item das zu messende Konstrukt wirklich bzw. hinreichend präzise abbildet (Bühner, 2011). Eine empirische Prüfung der Inhaltsvalidität ist meist nicht möglich. Um zu überprüfen, ob ein Verfahren inhaltlich valide ist, wird üblicherweise dessen Konstruktion detailliert beleuchtet (Rammstedt, 2010b). Die inhaltliche Validität ist gegeben, wenn das zu messende Konstrukt a priori hinreichend definiert und die Items von einem Expertengremium im Hinblick auf ihre Gültigkeit beurteilt werden. Die inhaltliche Validität der KSE-G wurde sichergestellt, indem die Formulierung der Items eng an der Definition des Konstrukts orientiert war. Außerdem wurden die Itemformulierungen von einem Expertengremium generiert bzw. modifiziert und anschließend in einem kognitiven Pretest für die anvisierte Zielgruppe optimiert.
Faktorielle Validität kann als gegeben angesehen werden, wenn die Annahmen über die dimensionale Struktur des zu erfassenden Konstrukts überprüfbar sind und belegt werden können. Im Rahmen einer konfirmatorischen Faktorenanalyse (CFA) wurde geprüft, ob ein zweifaktorielles obliques Modell auf die Daten von Stichprobe 2 passt, da sich die Items der KSE-G in den explorativen Analysen mit den Konstruktionsstichproben meist auf zwei Faktoren aufteilten. Die Fitindizes zeigen eine akzeptable Passung des Modells auf die Daten an (χ² = 20.7, df = 8, p < .05, RMSEA = .05, CFI = .99). Alle Items laden substantiell und hoch auf jeweils einem Faktor (siehe Tabelle 3). Die Interkorrelation der beiden Faktoren beträgt r = - .60.
Faktorladungen des KSE-G-Items in Stichprobe 2
F1 |
F2 |
|
1. Es ist schon mal vorgekommen, dass ich jemanden ausgenutzt habe. |
.78 |
|
2. Auch wenn ich selbst gestresst bin, behandle ich andere immer freundlich und zuvorkommend. |
.72 |
|
3. Manchmal helfe ich jemandem nur, wenn ich eine Gegenleistung erwarten kann. |
.66 |
|
4. Im Streit bleibe ich stets sachlich und objektiv. |
.61 |
|
5. Ich habe schon mal Müll einfach in die Landschaft oder auf die Straße geworfen. |
.74 |
|
6. Wenn ich mich mit jemandem unterhalte, höre ich ihm immer aufmerksam zu. |
.64 |
Anm.: N = 566 (Bedingung mit normaler Instruktion der KSE-G).
Bei der Konstruktvalidierung werden anhand theoretischer Überlegungen positive, negative und Nullbeziehungen einer zu validierenden Skala mit anderen empirischen Indikatoren postuliert (nomologisches Netzwerk) und getestet, ob sich das vorhergesagte Muster empirisch belegen lässt (Krohne & Hock, 2007). Im Rahmen der Validierung der KSE-G wurde zunächst eine Korrelation mit alternativen Maßen der sozialen Erwünschtheit berechnet. Anschließend wurde versucht, weitere aus der Fachliteratur bekannte typische Korrelate von Gamma mit der KSE-G zu replizieren. Die praktische Bedeutsamkeit der im Folgenden berichteten empirisch ermittelten Validitätskoeffizienten aus den Stichproben 2 und 3 wird nach den Richtlinien von Cohen (1992) vorgenommen: kleiner Effekt (r = .10), mittlerer Effekt (r = .30), starker Effekt (r = .50).
Die höchste Korrelation weist die KSE-G erwartungsgemäß mit einem alternativen Maß für das Konstrukt auf, mit der „Lügenskala“ aus dem MMPI-2 (siehe Tabelle 4). Die „L-Skala“ misst „die Neigung, sich in der Testsituation zu verstellen und marginale Charakterschwächen zu leugnen, um als ideale Persönlichkeit zu erscheinen“ (Hank & Schwenkmezger, 2003, S. 295). Sowohl PQ+ als auch NQ- korrelieren moderat bis hoch mit der L-Skala. Geringe bis mittlere Korrelationen finden sich mit den Selbsttäuschungsskalen von Edwards und Paulhus. Unkorreliert ist die KSE-G mit der Impression Management-Skala (Fremdtäuschungsskala) aus dem BIDR. Neben den Korrelationen mit alternativen Maßen für soziale Erwünschtheit, stützen auch die Korrelationen mit den Devianzmaßen die Gültigkeit der KSE-G. Diese zeigen, dass Personen, die Gesetzesübertretungen wie Fahren ohne Fahrkarte oder Diebstahl zugeben, eher weniger dazu neigen ihre positiven Qualitäten zu übertreiben bzw. negative zu untertreiben. Sowohl für PQ+ als auch für NQ- finden sich geringe bis mittlere negative Zusammenhänge mit den Devianzmaßen.
Validitätskoeffizienten der KSE-G.
PQ+ |
NQ- |
||
Soziodemographische Variablen1 |
Alter |
.14** |
.30** |
Geschlecht |
.00 |
.18** |
|
Bildung (Jahre) |
.00 |
-.10* |
|
Bildung (Bücher) |
.00 |
-.03 |
|
Einkommen |
-.02 |
-.06 |
|
Devianz1 |
Fahren ohne Fahrkarte |
-.22** |
-.38** |
Fahren mit über 0.5 |
-.09* |
-.29** |
|
Diebstahl |
-.12** |
-.33** |
|
Steuerhinterziehung |
-.08 |
-.28** |
|
Persönlichkeit1 |
Neurozitismus |
-.18** |
-.09** |
Extraversion |
.06 |
.01 |
|
Offenheit |
.10* |
.12** |
|
Verträglichkeit |
.20** |
.21** |
|
Gewissenhaftigkeit |
.33** |
.40** |
|
Soziale Erwünschtheit2 |
MMPI-2 Lügenskala |
.43** |
-.38** |
BIDR-SDS |
.12** |
-.03 |
|
BIDR-IM |
.05 |
.00 |
|
SDS-E |
.11** |
-.25** |
Anm.: PQ+ = Übertreibung positiver Qualitäten, NQ- = Minimierung negativer Qualitäten, MMPI-2 = Minnesota Multiphasic Personality Inventory-2, BIDR-SDS/IM = Balanced Inventory of Desirable Responding - Subscale Self-Deception/Impression Management, SDS-E = Edwards Social Desirability Scale. Kodierung Geschlecht: 1 = männlich, 2 = weiblich. 1 Stichprobe 2 (N = 566), 2 Stichprobe 3 (N = 309-939). * p < .05, ** p < .01
Mit soziodemographischen Variablen zeigen sich differentielle Zusammenhänge für die KSE-G. PQ+ und NQ- sind geringfügig bis moderat mit dem Alter korreliert. Demnach neigen eher ältere Menschen zur Übertreibung positiver Qualitäten und zur Untertreibung negativer. Geschlecht ist ausschließlich mit der Untertreibung negativer Qualitäten assoziiert. Dies gilt der Richtung des Zusammenhangs nach eher für Frauen als für Männer.
Anhand der folgenden Korrelationen kann festgestellt werden, ob bei der Beantwortung von Persönlichkeitsitems in Stichprobe 2 ein Bias auftrat und welcher Art dieser Bias war. Dazu wurden Korrelationen der KSE-G mit den Items aus dem BFI-10 und den Items zur Erfassung von Werten nach Schwartz (1992; Schwartz & Boehnke, 2004) berechnet. Substantielle geringe bis mittlere Korrelationen weist die KSE-G mit allen Skalen des BFI-10 außer Extraversion auf. Die höchsten Korrelationen finden sich für Gewissenhaftigkeit und Verträglichkeit. Auch mit Neurotizimus korreliert die KSE-G (negativ). Dieses Muster an Befunden spricht für einen moralistischen Bias (assoziiert mit dem Gamma-Faktor) in den Antworten der Befragungspersonen (vgl. Paulhus, 2002).
Die Items zur Erfassung von Werten nach dem Modell von Schwartz wurden auf der Grundlage der Konstruktbeschreibung von Bakan (1966) und Paulhus (2002) ad hoc in Agency- und Communion-Werte klassifiziert. Die Korrelationen zwischen der KSE-G und den Werteitems sind in Tabelle 5 dargestellt. Die Werteitems, die sich auf Communion-Werte beziehen, korrelieren durchweg substantiell in geringer bis moderater Höhe mit der KSE-G. Die über die Items aggregierte Korrelation beträgt .21 für PQ+ und .25 für NQ-. Für die Agency-Items zeigen sich nur marginal positive bzw. einige gering bis moderat negative Korrelationen. Die über die Items aggregierte Korrelation beträgt -.03 für PQ+ und -.11 für NQ-. Auch dieses Befundmuster legt einen moralistischen Bias nahe, der sich in den Antworten der Befragungspersonen auf die Werteitems manifestiert hat.
Tabelle 5. Korrelationen des KSE-G mit Werteitems aus dem Modell von Schwartz (1992; Schwartz & Boehnke, 2004) in Stichprobe 2.
PQ+ |
NQ- |
|
Communion-Werte |
||
Alle Gesetze zu befolgen, ist ihm/ihr wichtig. |
.23** |
.27** |
Es ist ihm/ihr sehr wichtig, den Menschen zu helfen, die ihm/ihr am Herzen liegen. |
.21** |
.27** |
Es ist ihm/ihr wichtig, traditionelle Werte und Glaubensvorstellungen zu bewahren. |
.17** |
.20** |
Seiner/Ihrer Meinung nach ist es wichtig, dass jeder Mensch auf der Welt die gleichen Chancen hat im Leben. |
.21** |
.22** |
Er/Sie ist der festen Überzeugung, dass er/sie sich für die Umwelt einsetzen soll. |
.22** |
.27** |
Agency-Werte |
||
Er/Sie möchte, dass die Leute seine/ihre Leistungen bewundern. |
-.05 |
-.24** |
Er/Sie möchte, dass die Leute tun was er/sie sagt. |
-.08* |
-.22** |
Reich zu sein, ist ihm/ihr wichtig. |
-.15** |
-.26** |
Es ist ihm/ihr wichtig niemals ein Risiko einzugehen. |
.05 |
.15** |
Die Freiheit zu haben, zu wählen, was er/sie tut, ist ihm/ihr wichtig. |
.08** |
.02 |
Anm.: PQ+ = Übertreibung positiver Qualitäten, NQ- = Untertreibung negativer Qualitäten. N = 566 (Bedingung mit normaler Instruktion der KSE-G).
Als weiterer Aspekt der Konstruktvalidität neben den oben berichteten Validitätskoeffizienten wurde geprüft, ob die Skalenwerte für PQ+ und NQ- änderungssensitiv sind, d.h. durch experimentelle Manipulation verändert werden können, da Paulhus in seinem integrativen Modell auch einen situationsabhängigen Aspekt des Gamma-Faktors konzeptualisiert: Communion-Management. Die experimentelle Variation in Stichprobe 2, die Befragungspersonen um ehrliche Antworten zu bitten, führte zu differentiellen Effekten auf die KSE-G. Für PQ+ fanden sich keine Unterschiede zwischen den experimentellen Bedingungen (t = 1.43, df = 1132, p > .05, Hedges g = .06). Für NQ- zeigten sich hingegen substantielle und praktisch bedeutsame Unterschiede (t = 2.11, df = 1132, p < .05, Hedges g = .13). Befragungspersonen, die gebeten wurden möglichst ehrlich zu antworten, zeigten geringere Werte bei der Untertreibung negativer Qualitäten (M = 3.14, SD = .81) im Vergleich zu Befragungspersonen, die nur die übliche Instruktion für die KSE-G bekamen (M = 3.24, SD = .78).
Deskriptive Statistiken
In Tabelle 6 und in Tabelle 7 sind Referenzwerte in Form von Gruppenmittelwerten und Standardabweichungen für die KSE-G abgedruckt. Diese wurden anhand der Zufallsstichprobe (Stichprobe 2) ermittelt und erlauben dem Anwender einen Vergleich der KSE-G-Werte aus seiner Untersuchung mit denen relevanter Subgruppen aus einer bevölkerungsrepräsentativen Zufallsstichprobe, zum Beispiel von Männern oder Frauen, von Personen mit unterschiedlicher Schulbildung oder unterschiedlichen Alters. Die Altersgruppen in Tabelle 6 und in Tabelle 7 wurden den Lebensphasen der bundesdeutschen Gesellschaft angepasst. Die Zeit von 18 bis 35 Jahren ist die der beruflichen Ausbildung und Familiengründung. Die Zeit der beruflichen Festigung, Karriere, Betreuung heranwachsender Kinder und Pflege älterer Angehöriger fällt in die Zeit zwischen 36 und 65 Jahren. Die dritte Lebensphase beginnt im Alter von 65 Jahren, wenn die berufliche Tätigkeit in den meisten Fällen abgeschlossen ist. Die Aufteilung der Bildungsstufen wurde nach der Dauer der schulischen Allgemeinbildung vorgenommen. Dabei gilt die Dauer der schulischen Bildung bis einschließlich 9 Jahren als geringes Bildungsniveau. Bei einer Schuldauer von 10 oder 11 Jahren handelt es sich um ein mittleres Bildungsniveau und bei mehr als 11 Jahren um ein hohes Bildungsniveau.
KSE-G PQ+ (Übertreibung positiver Qualitäten)
Geschlecht |
Bildung |
Altersgruppen |
Gesamt (Alter) |
||||||
|
|
18 - 35 |
36 - 65 |
> 65 |
|
|
|||
|
|
M |
SD |
M |
SD |
M |
SD |
M |
SD |
Männlich |
gering |
2.33 |
0.77 |
2.72 |
0.72 |
2.84 |
0.67 |
2.73 |
0.72 |
mittel |
2.51 |
0.76 |
2.73 |
0.71 |
2.90 |
0.72 |
2.74 |
0.73 |
|
hoch |
2.70 |
0.82 |
2.74 |
0.66 |
2.89 |
0.74 |
2.76 |
0.73 |
|
Gesamt |
2.54 |
0.80 |
2.73 |
0.70 |
2.87 |
0.69 |
2.74 |
0.72 |
|
Weiblich |
gering |
2.21 |
0.72 |
2.53 |
0.73 |
2.79 |
0.69 |
2.64 |
0.73 |
mittel |
2.79 |
0.70 |
2.66 |
0.71 |
2.95 |
0.84 |
2.74 |
0.78 |
|
hoch |
2.64 |
0.81 |
2.86 |
0.66 |
3.26 |
0.49 |
2.83 |
0.76 |
|
Gesamt |
2.65 |
0.76 |
2.67 |
0.70 |
2.88 |
0.72 |
2.73 |
0.76 |
|
Gesamt (Geschlecht) |
gering |
2.28 |
0.75 |
2.62 |
0.73 |
2.82 |
0.68 |
2.68 |
0.73 |
mittel |
2.71 |
0.72 |
2.68 |
0.76 |
2.92 |
0.77 |
2.74 |
0.76 |
|
hoch |
2.66 |
0.81 |
2.80 |
0.71 |
3.04 |
0.67 |
2.80 |
0.75 |
|
Gesamt |
2.61 |
0.76 |
2.70 |
0.74 |
2.88 |
0.71 |
2.73 |
0.74 |
Anm.: N = 566
KSE-G NQ- (Untertreibung negativer Qualitäten)
Geschlecht |
Bildung |
Altersgruppen |
Gesamt (Alter) |
||||||
|
|
18 - 35 |
36 - 65 |
> 65 |
|
|
|||
|
|
M |
SD |
M |
SD |
M |
SD |
M |
SD |
Männlich |
gering |
2.51 |
1.08 |
3.08 |
0.84 |
3.36 |
0.66 |
3.15 |
0.83 |
mittel |
2.61 |
1.01 |
3.08 |
0.72 |
3.43 |
0.62 |
3.09 |
0.80 |
|
hoch |
2.72 |
0.93 |
2.96 |
0.96 |
3.20 |
0.84 |
2.94 |
0.94 |
|
Gesamt |
2.63 |
0.99 |
3.04 |
0.84 |
3.35 |
0.68 |
3.07 |
0.85 |
|
Weiblich |
gering |
2.58 |
0.78 |
3.26 |
0.74 |
3.56 |
0.67 |
3.36 |
0.76 |
mittel |
2.99 |
0.79 |
3.24 |
0.71 |
3.59 |
0.62 |
3.23 |
0.74 |
|
hoch |
3.04 |
0.77 |
3.40 |
0.59 |
3.38 |
0.70 |
3.26 |
0.70 |
|
Gesamt |
2.96 |
0.79 |
3.29 |
0.69 |
3.55 |
0.66 |
3.28 |
0.74 |
|
Gesamt (Geschlecht) |
gering |
2.54 |
0.95 |
3.17 |
0.79 |
3.46 |
0.67 |
3.26 |
0.80 |
mittel |
2.88 |
0.87 |
3.18 |
0.72 |
3.50 |
0.62 |
3.18 |
0.77 |
|
hoch |
2.91 |
0.85 |
3.19 |
0.82 |
3.28 |
0.78 |
3.11 |
0.83 |
|
Gesamt |
2.83 |
0.89 |
3.18 |
0.77 |
3.45 |
0.68 |
3.19 |
0.80 |
Anm.: N = 566
Die Skala wurde unter anderem in folgenden Studien eingesetzt:
- Allgemeine Bevölkerungsumfrage der Sozialwissenschaften ALLBUS 2006 (ZA4500), ähnliche Formulierung eines Items