Items
Bitte schätzen Sie die Attraktivität der Befragungsperson ein. Geben Sie an, wie attraktiv oder unattraktiv die Befragungsperson im Vergleich zu der unten abgebildeten Person ist.
Antwortvorgaben
Als Anker für die Attraktivitätseinschätzung wird zusammen mit der elfstufigen Antwortskala das Bild einer durchschnittlich attraktiven Person des gleichen Geschlechts und der gleichen Altersgruppe wie die zu beurteilende Person dargeboten. Die Einschätzung der Attraktivität erfolgt relativ zu diesem Vergleichsmaßstab, dem Ankerbild. Die elf Antwortkategorien des AR1 reichen von „viel unattraktiver“ (-5) bis „viel attraktiver“ (5) mit einer neutralen Mittelkategorie „gleich attraktiv“ (0), über der das Ankerbild dargeboten wird. Insgesamt gibt es sechs Skalenvarianten, die sich nur im Ankerbild unterscheiden. Jede enthält ein Ankerbild, das dem Geschlecht (männlich oder weiblich) und dem Alter (junges, mittleres oder hohes Alter) der zu beurteilenden Person (annähernd) entspricht.
Für die Anwendung des AR1 in Erhebungen steht eine Vorlage zur Verfügung. Diese enthält die Instruktion, ein Ankerbild (als Beispiel) und die Antwortskala des AR1. Aufgrund des Copyrights können die sechs Ankerbilder, die als Grundlage der Skalenvarianten dienen, allerdings nicht an dieser Stelle abgedruckt werden. Die Ankerbilder des AR1 stammen aus der FACES-Datenbank des Max-Planck-Instituts für Bildungsforschung in Berlin (http://faces.mpdl.mpg.de). Ausgewählt wurden Bilder mit neutralem Gesichtsausdruck. Um die Ankerbilder zu Forschungszwecken einsetzen zu dürfen, ist eine Anmeldung beim Max-Planck-Institut für Bildungsforschung notwendig (siehe Anleitung). Die Ankerbilder der AR1 tragen die IDs 167, 054, 178, 080, 027 und 133 (aus Set A der Datenbank). Die Zuordnung der Ankerbilder zu den Skalenvarianten ist wie folgt: ID 167 für die Skalenvariante, die zur Einschätzung junger Männer im Alter von 18 - 35 Jahren verwendet wird, ID 054 für junge Frauen im Alter von 18 - 35 Jahren, ID 178 für Männer mittleren Alters (35 - 55 Jahre), ID 080 für Frauen mittleren Alters (35 - 55 Jahre), ID 027 für Männer hohen Alters (56 Jahre und älter), ID 133 für Frauen höheren Alters (56 Jahre und älter). Vor der Anwendung der AR1 in Erhebungen müssen die sechs Skalenvarianten zunächst erstellt werden, indem die oben genannten Bilder in die Vorlage eingesetzt werden. Das dort aktuell enthaltene Ankerbild ist lediglich ein Beispielbild (ID 116), dessen Veröffentlichung vom Max-Planck-Institut für Bildungsforschung genehmigt wurde. Es gehört nicht zu einer der Skalenvarianten des AR1.
Auswertungshinweise
Da das AR1 aus nur einem Item besteht, stellt die Antwort des Beurteilers auf das Item gleichzeitig den Skalenwert dar. Der Wertebereich des Skalenwerts liegt zwischen -5 und 5.
Anwendungsbereich
Das AR1 wurde als Forschungsinstrument für sozialwissenschaftliche Untersuchungen unterschiedlichster Art und Fragestellung entwickelt. Das AR1 kann entweder zur Fremdbeurteilung eingesetzt werden, d.h. ein Interviewer schätzt die Attraktivität einer Befragungsperson ein, oder zur Selbstbeurteilung, d.h. die Befragungsperson schätzt ihre eigene Attraktivität ein. Die Itemformulierung wurde mittels kognitiver Pretests optimiert, sodass Personen aus der deutschsprachigen Allgemeinbevölkerung ab 18 Jahren damit umgehen können. Ausgenommen sind Personen, deren sprachliche oder kognitive Fähigkeiten oder deren Wahrnehmungsfähigkeiten, z. B. durch Seh- oder Hörschwäche, unzureichend sind, um die Items zu verstehen.
Das AR1 kann prinzipiell in unterschiedlichen Erhebungsmodi eingesetzt werden. Allerdings sind aufgrund zweier Anwendungsvoraussetzungen manche Modi weniger geeignet als andere. Zum Einen erfolgt die Einschätzung der Attraktivität abhängig vom Alter und Geschlecht der Befragungsperson. Diese Daten müssen demnach vor jeder Einschätzung erhoben werden. Zum Anderen sollte die Befragungsperson im Falle einer Fremdbeurteilung durch den Interviewer die Einschätzung ihrer Attraktivität nicht bemerken, da dies negative Effekte auf die Interviewsituation haben könnte. Beide Aspekte legen die Modi fest, in denen das AR1 sinnvoll einsetzbar ist. Alter und Geschlecht vor einer Einschätzung zu erheben und der/dem BeurteilerInn (Interviewer oder Befragungsperson) die passende Skalenvariante vorzugeben, ist prinzipiell bei allen Arten von computerunterstützen Erhebungen möglich, z.B. im CAPI-Modus (Computer Assisted Personal Interview), im CAWI-Modus (Computer Assisted Web Interview) und im CASI-Modus (Computer Assisted Self Interview). PAPI-Modus (Paper Assisted Personal Interview) und Selbstausfüller sind hingegen weniger geeignet, da der Interviewer nach der Erfragung von Alter und Geschlecht im Fragebogen blättern muss, um eine Einschätzung vorzunehmen und dies der Befragungsperson vermutlich auffällt. Bei einer Selbstbeurteilung durch die Befragungsperson muss diese selbst eine der sechs Skalenvarianten auswählen. Dieser Prozess scheint fehleranfällig und wenig praktikabel.
Die Durchführungsdauer des AR1 ist minimal. In 75% der CAPI-Interviews, in dem ein Interviewer eine Befragungsperson anhand des AR1 beurteilt, dauert die Durchführung 20 Sekunden oder weniger (P75 = 20). Wenn die Skala zur Selbstbeschreibung der Befragungsperson verwendet werden soll, z.B. im CASI, dauert die Durchführung in 75% der CASI-Interviews 40 Sekunden oder weniger (P75 = 40). Ein weiterer wichtiger Aspekt bei der Verwendung des AR1 ist die Interviewerschulung. Die Reliabilität des AR1 hängt maßgeblich von der korrekten Anwendung durch den Interviewer ab (siehe Abschnitt Reliabilität). Dem Interviewer muss klar sein, dass er die relative und nicht die absolute Attraktivität von Befragungspersonen einschätzen soll.
Physische Attraktivität ist bereits seit dem 19. Jahrhundert (Galton, 1878) Betrachtungsgegenstand der psychologischen Forschung. Vor einem meist evolutionspsychologischen Hintergrund steht dabei oftmals die Frage im Mittelpunkt, welche physischen Merkmalsausprägungen als attraktiv wahrgenommen werden, inwiefern diese Ausprägungen tatsächliche Indikatoren interindividueller Unterschiede in reproduktiver Fitness der beurteilten Person darstellen und in welchen Beziehungen Attraktivitätseinschätzungen zu menschlichem Denken, Erleben und Verhalten stehen. Die physische Attraktivität einer Person erschließt sich für einen Betrachter aus einer Vielzahl körperlicher Attribute. Neben der Körperkomposition, dem Erscheinungsbild der Haut und der Stimme, sind es vor allem die Gesichtszüge, die einer Attraktivitätseinschätzung zugrunde liegen. Im Allgemeinen beurteilen Menschen symmetrische und durchschnittliche, prototypische Gesichter als attraktiv (Fink & Penton-Voak, 2002).
Die Wahrnehmung von Attraktivität scheint ein biologisch verwurzelter, genereller und kulturübergreifender Prozess zu sein. Frauen und Männer verschiedener Kulturen und sozialer Gruppen zeigen eine hohe Übereinstimmung in Attraktivitätseinschätzungen (Langlois, Kalakanis, Rubenstein, Larson, Hallam, & Smoot, 2000; Thornhill & Gangestad, 1999) und schon bei Neugeborenen zeigt sich eine Präferenz für attraktive Gesichter (Ramsey, Langlois, Hoss, Rubenstein, & Griffin, 2004). Neurowissenschaftliche Forschung identifizierte desweiteren spezifische Hirnstrukturen, die bei der Verarbeitung attraktivitätsbezogener Reize beteiligt sind (z.B. Winston, O’Doherty, Kilner, Perrett, & Dolan, 2007).
Diese Befunde werden im Rahmen evolutionstheoretischer Ansätze damit erklärt, dass Gesichtszüge valide Informationen über die reproduktive Eignung einer Person vermitteln (vgl. Gallup & Frederick, 2010). Tatsächlich finden sich vielfältige Korrelationen von Attraktivitätseinschätzungen mit verschiedensten Domänen menschlichen Erlebens, Denkens und Sozialverhaltens. Neben der offensichtlichen Rolle bei der Partnerwahl (Rhodes, 2006) steht physische Attraktivität in positivem Zusammenhang mit der allgemeinen Gesundheit (Thornhill & Gangestad, 1999), der Anzahl der Nachkommen (Jokela, 2009), Intelligenz (Kanazawa & Kovar, 2004), dem durchschnittlichen Einkommen (Frieze, Olson & Russell, 1991; Judge, Hurst & Simon, 2009) und verschiedenen anderen Kriterien des Berufserfolgs (Hosoda, Stone-Romero & Coats, 2003). Desweiteren beeinflusst die Attraktivitätseinschätzung eine Reihe sozialer Inferenzen wie die Zuschreibung von Kompetenz und Status, prosozialer Orientierung, Integrität und sozialer Anpassung (Eagly, Makhijani, Ashmore, & Longo, 1991; Kalick, 1987).
Physische Attraktivität wird standardmäßig durch die subjektiven Einschätzungen von Beurteilern anhand bipolarer Ratingskalen mit verbalen Ankern z.B. von „gar nicht attraktiv“ bis „sehr attraktiv“ erhoben (Langlois et al., 2000). Den Beurteilern wird dabei ein Foto der zu bewertenden Person vorgelegt und das subjektive Attraktivitätsrating auf der Skala festgehalten. Die Raterübereinstimmung (Konsensus) wird über die Berechnung statistischer Kennwerte wie Kappa (Cohen, 1960; Fleiss, 1971) oder dem Intraklassenkorrelationskoeffizienten (ICC; Shrout & Fleiss, 1979) ermittelt.
Die Nutzung solcher subjektiver Urteile hat sich jedoch als fehleranfällig bzw. sensibel für Charakteristika des Interviewers / Beurteilers erwiesen (Henss, 1991; Hönekopp, 2006; Nedelec & Beaver, 2011). So unterscheiden sich beispielsweise weibliche und männliche BeurteilerInnen in der Attraktivitätseinschätzung von Männern (Nedelec & Beaver, 2011). Während Männer eher zu mittleren Urteilen neigen, beurteilen Frauen Männer im Vergleich öfter als sehr attraktiv oder sehr unattraktiv. Der generell negative Zusammenhang zwischen Alter und Attraktivität bei Attraktivitätseinschätzungen wird ebenfalls durch das Geschlecht und das Alter des Beurteilers beeinflusst (Henss, 1991). Bei Beurteilung von Personen des eigenen Geschlechts oder der eigenen Altersgruppe fällt der Zusammenhang zwischen Alter und Attraktivität signifikant niedriger aus. Kognitionspsychologische Untersuchungen unterstützen die Rolle des Alters und Geschlechts des Beurteilers bei der Verarbeitung und Erinnerung von Gesichtszügen (Anastasi & Rhodes, 2006; Brigham & Barkowitz,1978). Als own-age bias wird der Effekt bezeichnet, dass Gesichter von Personen der eigenen Altersgruppe besser wiedererkannt werden als Gesichter von älteren oder jüngeren Menschen. Dies wird mit der Häufigkeit erklärt, mit der Menschen mit bestimmten Gesichtern konfrontiert werden (Bartlett & Fulton, 1991). Gesichter, die dem eigenen ähnlich sind, z.B. der gleichen Altersgruppe, werden häufiger betrachtet und durch die resultierende Gewöhnung leichter wiedererkannt.
Diese Befunde verdeutlichen die Beeinflussbarkeit von Attraktivitätseinschätzungen durch individuelle Charakteristika der Beurteiler. Besonders das Geschlecht und das Alter der Rater können zu einer Verzerrung der Ergebnisse auf häufig genutzten Standardratingskalen führen. Im Rahmen der vorliegenden Arbeit wurde eine alternative Ratingskala zur Einschätzung von Attraktivität (Attraktivitätsrating-1, AR1) mit dem Ziel konstruiert, die oben beschriebenen Fehlerquellen zu minimieren. Zu diesem Zweck wird ein nach Alter und Geschlecht der zu beurteilenden Person gematchtes Bild als Anker des Attraktivitätsratings benutzt.
Itemkonstruktion und Itemselektion
Ziel der Skalenkonstruktion war es, eine Messung der physischen Attraktivität von Befragungspersonen zu ermöglichen, bei der Verzerrungen durch Beurteilermerkmale wie Alter und Geschlecht weitgehend kontrolliert werden können. Dies sollte über ein Messkonzept ermöglicht werden, bei dem Einschätzungen der Attraktivität einer Person (fortan auch Zielperson) relativ zu einer Person mit durchschnittlicher Attraktivität desselben Geschlechts und derselben Altersgruppe vorgenommen werden. Durch die Verwendung eines Ankerbilds mit Gesicht als Grundlage für die relative Einschätzung beziehen wir die physische Attraktivität einer Zielperson ausschließlich auf ihr Gesicht. Dies ist in gewisser Weise eine reduktionistische Sichtweise des Konstrukts, deckt sich aber mit Befunden aus der Attraktivitätsforschung, nach denen das Gesicht die wichtigste Quelle für eine Einschätzung der physischen Attraktivität ist (Mueser, Grau, Sussman & Rosen, 1984; Peters, Rhodes & Simmons, 2007).
Das AR1 wurde in drei Schritten anhand dreier alters-, geschlechts- und bildungsheterogener Stichproben entwickelt und validiert.
Als Ausgangspunkt für die Skalenkonstruktion wurde die FACES-Datenbank (Ebner, Riediger & Lindenberger, 2010) verwendet. Daraus wurden 171 durch eine Modelagentur vorselegierte Bilder von Personen mit durchschnittlicher Attraktivität (fortan Modelle) ohne emotionalen Ausdruck (Ebner, persönliche Mitteilung, 14.06.2010) entnommen. Ziel dieses Konstruktionsschritts war es, für jede mögliche Zielperson einen im Hinblick auf Alter und Geschlecht möglichst repräsentativen Vertreter mittlerer Attraktivität als Ankerbild auszuwählen, so dass beim zukünftigen Einsatz der Skala eine Verzerrung durch Alter und Geschlecht der BeurteilerInnen minimiert wird. Die 171 Bilder der Modelle wurden daher in sechs Gruppen eingeteilt, in junge, mittelalte und ältere Männer und Frauen (jeweils 27-29 Bilder), und vier Beurteilern vorgelegt. Diese schätzten die Attraktivität der Modelle anhand einer siebenstufigen Skala von „gar nicht attraktiv“ bis „sehr attraktiv“ ein. Diese Einschätzungen wurden aggregiert. Anschließend wurden aus jeder Gruppe 10 Bilder selegiert mit (a) mittleren Attraktivitätseinschätzungen und (b) einem wahrgenommenen Alter (vgl. Ebner et al., 2010) im Bereich von 25-30, 45-50, 65-70 Jahren.
Im zweiten Schritt wurden aus den 10 Bildern pro Gruppe sechs Bilder ausgewählt. Die resultierenden 36 Bilder wurden mit Instruktionen und Antwortskala von „gar nicht attraktiv“ (1) bis „sehr attraktiv“ (7) in den Fragebogen von Stichprobe 1 integriert (siehe Tabelle 1). Die Erhebung erfolgte in zwei Wellen mit einem zeitlichen Abstand von 6 bis 10 Wochen. Aus Platzgründen konnten die Bilder nur in Welle 1 vorgegeben werden. Die Daten von Stichprobe 1 wurden im Rahmen eines persönlich-mündlichen Interviews (CAPI) oder durch die Vorgabe eines Papierfragebogens erhoben. Für die Einschätzung der 36 Bilder wurde ein Papierfragebogen vorgegeben. Die Erhebung dauerte insgesamt im Mittel 53 Minuten (SD = 12). Für die Auswahl von Ankerbildern durchschnittlich attraktiver Modelle wurde die Stichprobe der Befragungspersonen beziehungsweise BeurteilerInnen nach Alter und Geschlecht in sechs Gruppen unterteilt. Die Attraktivitätseinschätzungen wurden anschließend innerhalb jeder Gruppe gemittelt und aus jeder Gruppe wurde ein Bild mit mittlerer Attraktivitätseinschätzung gewählt. Das heißt, dass zum Beispiel das Ankerbild für die (Einschätzung der Attraktivität von) älteren Männern anhand der gemittelten Einschätzungen der älteren männlichen BeurteilerInnen aus Stichprobe 1 ausgesucht wurde. Als Modelle mittlerer Attraktivität wurden die Bilder mit den IDs 167 als Anker für die Beurteilung von jungen Männern, 54 für die Beurteilung von jungen Frauen, 178 für die Beurteilung mittelalter Männer, 080 für die Beurteilung mittelalter Frauen, 027 für die Beurteilung älterer Männer und 133 für die Beurteilung älterer Frauen aus der FACES-Datenbank ausgewählt.
Um die Validität des AR1 zu prüfen, wurde die so konstruierte Skala schließlich zwei weiteren Stichproben vorgegeben. Stichprobe 2 wurde im Internet erhoben (CAWI, Computer Assissted Web Interview). Um die Validität des AR1 zu prüfen, ließen wir von den Befragungspersonen in Stichprobe 2 Attraktivitätseinschätzungen von Bildern vornehmen, die von den Beurteilern in Stichprobe 1 bereits eingeschätzt wurden. Für jede Alter × Geschlecht-Gruppe wurden drei Bilder von Modellen ausgewählt, die in Stichprobe 1 als gering, mittel oder hoch attraktiv eingeschätzt wurden. Die Attraktivität dieser Modelle wurde anhand des AR1 beurteilt. Wenn das AR1 eine valide Erfassung der Attraktivität erlaubt, dann sollten die Rangreihen der Einschätzungen von Stichprobe 1 und 2 annähernd übereinstimmen.
Eine weitere Überprüfung der Konstruktvalidität des AR1 fand in Stichprobe 3 statt. Die Fragebogenbatterie beinhaltete neben dem AR1 umfangreiche soziodemographische Angaben, weitere psychologische Maße (z.B. BFI-10, Rammstedt & John, 2007, IE-4, Kovaleva, Beierlein, Kemper & Rammstedt, 2012; AKSU, Beierlein, Kovaleva, Kemper, & Rammstedt, 2012) und einige sozialwissenschaftliche Validierungsmaße, z.B. Einkommen, (durch den Interviewer) zugeschriebener sozialer Status der Befragungsperson, Gesundheitszustand etc. Mit diesen Maßen wurden Validitätskoeffizienten für das AR1 berechnet. Außerdem wurde das AR1 zweimal vorgegeben, um die Übereinstimmung zwischen Selbsteinschätzung und Fremdeinschätzung zu ermitteln. Am Anfang des Interviews (CAPI) nahm der Interviewer eine Einschätzung der Attraktivität der Befragungsperson vor. Am Ende des Interviews folgte ein kurzer Teil des Fragebogens im CASI-Modus. In diesem sollte die Befragungsperson selbst ihre Attraktivität anhand des AR1 einschätzen.
Alle drei Erhebungen wurden von unabhängigen kommerziellen Anbietern durchgeführt.
Stichprobe
Stichprobe 1 (siehe Tabelle 1) ist eine Quotenstichprobe, geschichtet nach den Merkmalen Geschlecht, Alter, Bildung und Bundesland (N = 539). Die Grundgesamtheit war definiert als „alle in der Bundesrepublik Deutschland in Privathaushalten lebenden deutschsprachigen Personen ab 18 Jahren“.
Bei Stichprobe 2 handelt es sich um eine Quotenstichprobe, geschichtet nach Geschlecht, Alter und Bildung (N = 741). Grundgesamtheit waren die Teilnehmer eines Online-Access-Pools im Alter von 18 Jahren oder älter, die in Deutschland leben. Der Onlinefragebogen (Bearbeitungsdauer: M = 23 Minuten, SD = 8) enthielt soziodemographische Angaben, verschiedene Skalen zur Erfassung psychologischer Merkmale und das AR1.
Stichprobe 3 mit N = 1134 Befragungspersonen ist eine Zufallsstichprobe, die repräsentativ für die Wohnbevölkerung in Deutschland über einem Alter von 18 Jahren ist. Sie wurde mithilfe des ADM-Stichprobensystem F2F (Random Route) der Arbeitsgemeinschaft deutscher Marktforschungsinstitute gezogen. Die Daten dieses Interview wurden im CAPI- und CASI-Modus erhoben (Bearbeitungsdauer: M = 43, SD = 13).
Charakteristika der drei Stichproben
|
Stichprobe 1 |
Stichprobe 1 |
Stichprobe 2 |
Stichprobe 3 |
Stichprobe |
||||
Umfang [N] |
539 |
338 |
741 |
1134 |
Art |
Quote |
Quote |
Quote |
Zufall |
Modus |
CAPI, Papier |
CAPI, Papier |
CAWI |
CAPI |
Zusammensetzung |
||||
Geschlecht [% Frauen] |
52.5 |
52.1 |
51.8 |
55.6 |
Alter [M (SD)] |
47.2 (15.2) |
46.7 (15.1) |
48.3 (13.0) |
53.3 (18.4) |
Bildung ≤ 9 Jahre |
44.7 |
45.3 |
40.1 |
37.2 |
10 Jahre |
30.2 |
27.9 |
29.1 |
37.0 |
≥ 11 Jahre |
23.7 |
25.4 |
30.8 |
25.8 |
Anmerkung: CAPI = Computer Aided Personal Interview, CAWI = Computer Aided Web Interview, CASI = Computer Assisted Self Interview, Papier = Papierversion (Selbstausfüller)
Itemkennwerte
In Tabelle 2 sind Itemformulierung und deskriptive Statistiken des AR1 dargestellt. Sie basieren auf Daten einer umfangreichen, bevölkerungsrepräsentativen Zufallsstichprobe (Stichprobe 3, siehe Tabelle 1).
Itemformulierung und deskriptive Statistiken des AR1 aus Stichprobe 3
Item |
M |
SD |
Sch |
Kurt |
Bitte schätzen Sie die Attraktivität der Befragungsperson ein. Geben Sie an, wie attraktiv oder unattraktiv die Befragungsperson im Vergleich zu der unten abgebildeten Person ist. |
1.7 |
2.1 |
-.28 |
-.30 |
Anmerkung: M = Mittelwert, SD = Standardabweichung, Sch = Schiefe, Kurt = Kurtosis, N = 1134
Objektivität
Unter Objektivität wird der Grad verstanden, in dem eine Messung unabhängig vom Untersucher ist (vgl. Lienert & Raatz, 1998). Diese bezieht sich auf verschiedene Phasen einer Untersuchung: Durchführung, Auswertung und Interpretation. Im Falle eines Face-to-Face-Interviews hängt die Durchführungsobjektivität von dem Interviewer ab, der die Daten erhebt. Sie ist gegeben, wenn dieser sich bei der Vorgabe der Skala an die genauen Instruktionen und den Wortlaut der Items hält. Bei entsprechend geschulten Interviewern ist die Durchführungsobjektivität üblicherweise gewährleistet (Rammstedt, 2010b). Auswertungsobjektivität betrifft die numerische und kategoriale Auswertung des Antwortverhaltens der Befragten nach festgelegten Regeln (vgl. Lienert & Raatz, 1998). Diese ist beim AR1 vollständig gegeben, da jeder der elf Antwortkategorien eindeutig ein Zahlenwert zugewiesen wird. Interpretationsobjektivität ist gegeben, wenn die aus den Befragungsergebnissen gezogenen Schlüsse über verschiedene Forscher vergleichbar sind. Zur Maximierung der Interpretationsobjektivität sollte das Wissen der Forscher über die Messintention der Skala und über die Interpretation der quantitativen Messwerte vergleichbar sein (Rammstedt, 2010b). Durch die Normierung kann auch die Interpretationsobjektivität des AR1 als gegeben angesehen werden.
Unter der Reliabilität oder Messgenauigkeit einer Skala versteht man den Grad der Genauigkeit, mit dem ein bestimmtes Merkmal erfasst wird (vgl. Lienert & Raatz, 1998). Die Reliabilität des AR1 wurde über die Testwiederholungsmethode (Retest) bestimmt. Dazu wurde eine nicht-studentische Gelegenheitsstichprobe erhoben (N = 28; Alter: M = 36.1, SD = 14.9; 60.7% Männer). Anhand des AR1 wurde die Attraktivität von sechs Modellen eingeschätzt, deren Bilder gemeinsam mit dem AR1 dargeboten wurden. In einem zeitlichen Abstand von ca. einer Woche (M = 7.5 Tage, SD = 1.5) wurden den Teilnehmern dieselben sechs Modelle erneut zur Beurteilung vorgelegt. Um die Retestreliabilität zu ermitteln, wurden die Messwertreihen der beiden Testungen für jedes Modell miteinander korreliert. Die ermittelten Retest-Koeffizienten liegen in dieser Stichprobe zwischen rtt = .46 und .85. Für die Beurteilung der meisten Modelle in der Gelegenheitsstichprobe ergab sich demnach eine ausreichende bis gute Reliabilität für Gruppenuntersuchungen (vgl. Aiken & Groth-Marnat, 2006). Vereinzelt traten jedoch auch Reliabilitätskoeffizienten unterhalb der von Aiken und Groth-Marnat angegebenen Grenze von .60 auf. Diese geringen Koeffizienten ergaben sich aufgrund eines mangelnden Instruktionsverständnisses einzelner Beurteiler. Anstatt relative Attraktivitätsurteile abzugeben, gaben sie vereinzelt absolute Urteile ab.
Validität
Inhaltliche Validität ist gegeben, wenn ein Item das zu messende Konstrukt wirklich bzw. hinreichend präzise abbildet (Bühner, 2011). Im AR1 wird ein(e) BeurteilerIn gebeten, die Attraktivität einer Zielperson einzuschätzen. Anhand des Ratings erfolgt also eine direkte Zuweisung eines numerischen Messwertes für das Konstrukt Attraktivität. Die inhaltliche Validität des AR1 ist daher gegeben.
Konstruktvalidität ist gegeben, wenn sich der Messwert einer Skala als Indikator für das Merkmal eignet, das mit der Skala gemessen werden soll. Die Eignung wird daran beurteilt, wie gut sich die Skala im Hinblick auf Hypothesen, die sich aus dem Modell des zu erfassenden Merkmals ableiten lassen, empirisch bewährt. Bei der Konstruktvalidierung werden anhand theoretischer Überlegungen positive, negative und Nullbeziehungen einer zu validierenden Skala mit anderen empirischen Indikatoren postuliert (nomologisches Netzwerk) und getestet, ob sich das vorhergesagte Muster empirisch belegen lässt (Krohne & Hock, 2007).
Um die Konstruktvalidität des AR1 zu belegen, wurden für jede der sechs Skalenvarianten drei Bilder von Modellen ausgewählt, die von den Beurteilern in Stichprobe 1 als gering, mittel oder hoch attraktiv eingeschätzt wurden. Wenn das AR1 eine valide Einschätzung der Attraktivität erlaubt, dann sollten sich die Mittelwerte der drei unterschiedlich attraktiven Modelle deutlich voneinander unterscheiden. Die Einschätzung der Modelle aus Stichprobe 1 in „gering“, „mittel“ oder „hoch attraktiv“ sollte sich in den Mittelwerten des AR1 aus Stichprobe 2 widerspiegeln. Wenngleich die Attraktivität in beiden Stichproben mit unterschiedlichen Messkonzepten (absolute vs. relative Einschätzung) erfasst wurde, sollten die Rangreihen der Messwerte dennoch miteinander korrespondieren. Um dies zu prüfen, wurden sechs Varianzanalysen mit Messwiederholung durchgeführt. Messwiederholungsfaktor war die Attraktivität der Modelle (gering, mittel, hoch, klassifiziert nach Stichprobe 1). Die Ergebnisse sind in Tabelle 3 zu finden.
Mittelwerte und Standardabweichungen der AR1-Einschätzungen in Stichprobe 3 von Modellen mit geringer, mittlerer und hoher Attraktivität (eingeschätzt in Stichprobe 1) und Signifikanztests der Varianzanalyse
|
Attraktivität |
Effekt |
Trend (linear) |
||||
gering |
mittel |
hoch |
F(2,1474) |
ηp² |
F(1,737) |
ηp² |
|
Männlich, jung |
-0.91 (2.00) |
0.11 (1.94) |
1.07 (2.11) |
205.99*** |
.22 |
345.22*** |
.32 |
Weiblich, jung |
-0.50 (2.07) |
1.03 (2.00) |
2.20 (2.21) |
345.48*** |
.32 |
590.30*** |
.44 |
Männlich, mittelalt |
-1.15 (1.93) |
-0.69 (1.89) |
2.01 (2.17) |
573.49*** |
.44 |
798.92*** |
.52 |
Weiblich, mittelalt |
-0.96 (1.98) |
-0.43 (1.73) |
1.12 (2.19) |
266.68*** |
.27 |
385.16*** |
.34 |
Männlich, alt |
-1.63 (2.22) |
-0.16 (1.96) |
0.33 (2.13) |
255.03*** |
.23 |
337.18*** |
.31 |
Weiblich, alt |
-0.81 (1.68) |
1.46 (1.95) |
0.64 (1.81) |
313.27*** |
.30 |
260.76*** |
.26 |
Anmerkung: N = 741. F = Prüfstatistik des F-Tests. ηp² = Effektstärke (partielles Eta-Quadrat)
Bei allen sechs Skalenvarianten unterschieden sich die Attraktivitätseinschätzungen der drei Modelle deutlich voneinander. Modelle, die in Stichprobe 1 als „gering attraktiv“ eingeschätzt wurden, zeigten in Stichprobe 2 deutlich geringere Mittelwerte im Vergleich zu Modellen, die als „mittel“ oder „hoch attraktiv“ eingeschätzt wurden. Ein linearer Trend der Mittelwerte über die drei „Attraktivitätsstufen“ konnte beobachtet werden. Für fünf der sechs Skalenvarianten steigen die Mittelwerte des AR1 mit den Attraktivitätsstufen von „gering“ über „mittel“ bis „hoch attraktiv“ an. Einzige Ausnahme war die Skalenvariante zur Einschätzung von älteren Frauen. Hier korrespondierte die Höhe der Mittelwerte in der AR1 nicht mit den Stufen „mittel“ und „hoch attraktiv“. Die Stufe „hoch attraktiv“ wies einen niedrigeren Mittelwert als die Stufe „mittel“ Auf. Da die übrigen Befunde klare Übereinstimmungen zeigen, könnte dieser Effekt durch die spezifische Auswahl der Modelle für die Gruppe „weiblich/alt“ erklärt werden. Die praktische Bedeutsamkeit der Effekte der beobachteten Mittelwertsunterschiede und des linearen Anstiegs der Mittelwerte ist als groß einzustufen (ηp² > .14, nach Cohen, 1988). Demnach erlaubt das AR1 eine valide Erfassung unterschiedlicher Grade der Attraktivität von Befragungspersonen.
Um weitere Belege für die Konstruktvalidität des AR1 zu finden, wurde anhand von Stichprobe 3 versucht, aus der Fachliteratur bekannte typische Korrelate der Attraktivität zu replizieren. Die Validitätskoeffizienten sind in Tabelle 4 zu finden. Die praktische Bedeutsamkeit der im Folgenden berichteten Validitätskoeffizienten wird nach den Richtlinien von Cohen (1992) vorgenommen: kleiner Effekt (r = .10), mittlerer Effekt (r = .30), starker Effekt (r = .50). Die höchste Korrelation des AR1 (Fremdeinschätzung der Attraktivität der Zielperson) findet sich erwartungsgemäß mit der Selbsteinschätzung der Attraktivität der Zielperson (r = .46, p < .01). Desweiteren finden sich signifikante, wenn auch kleine Zusammenhänge der AR1-Werte mit soziodemographischen Variablen. So sind als attraktiver bewertete Befragungspersonen jünger, verfügen über eine bessere Bildung, ein größeres soziales Netzwerk und sind häufiger in einer festen Beziehung. Frauen werden generell als attraktiver beurteilt (r = .13, p < .01).
Validitätskoeffizienten des AR1 (Fremdeinschätzung) für Stichprobe 3
Attraktivität |
Selbsteinschätzung |
.46** |
Soziodemographische Variablen |
Alter |
-.18** |
Geschlecht |
.13** |
|
Einkommen |
.12** |
|
Bildung |
.18** |
|
Größe soziales Netzwerk |
.11** |
|
Partnerschaft ja / nein² |
.17** |
|
Status |
Zugeschriebener sozialer Status |
.22** |
Intelligenz |
Kristalline Intelligenz |
.20** |
Gesundheitsstatus |
Beeinträchtigung physisch |
-.18** |
Beeinträchtigung psychisch |
-.12** |
|
Selbstkonzept / -regulation |
Selbstwirksamkeit |
.21** |
Internale Kontrollüberzeugung |
.20** |
|
Externale Kontrollüberzeugung |
-.15** |
|
Persönlichkeit |
Neurotizismus |
-.09** |
Extraversion |
.21** |
|
Offenheit |
.19** |
|
Verträglichkeit |
.10** |
|
Gewissenhaftigkeit |
.20** |
Anmerkung: N = 1100 -1134. Geschlecht = männlich (1), weiblich (2). Bildung = gering (1), mittel (2), hoch (3) (siehe Normierung unten). Partnerschaft = (1) nein, (2) ja; ¹ N = 647, ² N = 53. * = p < .05, ** = p < .01.
Im Rahmen des Fünf-Faktoren-Modells der Persönlichkeit finden sich geringe bis mittlere Zusammenhänge der AR1-Werte mit Extraversion, Offenheit und Gewissenhaftigkeit. Zusätzlich zeigt sich ein, wenn auch schwacher, negativer Zusammenhang mit Neurotizismus. Auch mit Aspekten des Selbstkonzepts und der Selbstregulation bestehen differentielle Korrelationen. Befragungspersonen mit höheren AR1-Werten weisen eine höhere Selbstwirksamkeit und internale Kontrollüberzeugungen auf. Dagegen findet sich ein negativer Zusammenhang mit externalen Kontrollüberzeugungen. Übereinstimmend mit Ergebnissen der Attraktivitätsforschung korrelieren die AR1-Werte mit kristalliner Intelligenz (r = .20, p < .01), physischen und psychischen Beeinträchtigungen der Gesundheit (r = -.18 bzw. -.12, p < .01) und dem durch den Interviewer zugeschriebenen sozialen Status der Befragungsperson (r = .22, p < .01).
Deskriptive Statistiken
In Tabelle 5 sind Referenzwerte in Form von Gruppenmittelwerten und Standardabweichungen für das AR1 abgedruckt (Fremdeinschätzung der Attraktivität von Befragungspersonen durch den Interviewer). Diese wurden anhand der Zufallsstichprobe (Stichprobe 3) ermittelt und erlauben dem Anwender einen Vergleich der AR1-Werte aus seiner Untersuchung mit denen relevanter Subgruppen aus einer bevölkerungsrepräsentativen Zufallsstichprobe, zum Beispiel von Männern oder Frauen, von Personen mit unterschiedlicher Schulbildung oder unterschiedlichen Alters. Die Altersgruppen in der Tabelle 4 wurden den Lebensphasen der bundesdeutschen Gesellschaft angepasst. Die Zeit von 18 bis 35 Jahren ist die der beruflichen Ausbildung und Familiengründung. Die Zeit der beruflichen Festigung, Karriere, Betreuung heranwachsender Kinder und Pflege älterer Angehöriger fällt in die Zeit zwischen 36 und 65 Jahren. Die dritte Lebensphase beginnt im Alter von 65 Jahren, wenn die berufliche Tätigkeit in den meisten Fällen abgeschlossen ist. Die Aufteilung der Bildungsstufen wurde nach der Dauer der schulischen Allgemeinbildung vorgenommen. Dabei gilt die Dauer der schulischen Bildung bis einschließlich 9 Jahren als geringes Bildungsniveau. Bei einer Schuldauer von 10 oder 11 Jahren handelt es sich um ein mittleres Bildungsniveau und bei mehr als 11 Jahren um ein hohes Bildungsniveau.
Referenzwerte für die AR1
|
Bildung |
Altersgruppen |
Gesamt Alter |
||||||
|
|
18-35 |
36-65 |
>65 |
|
|
|||
|
|
M |
SD |
M |
SD |
M |
SD |
M |
SD |
Männlich |
gering |
1.23 |
1.80 |
1.05 |
2.15 |
0.83 |
1.95 |
0.97 |
2.01 |
mittel |
0.75 |
2.32 |
1.57 |
1.99 |
0.80 |
1.53 |
1.21 |
1.96 |
|
hoch |
1.92 |
1.95 |
2.51 |
1.71 |
1.20 |
1.79 |
2.05 |
1.86 |
|
Gesamt |
1.38 |
2.07 |
1.67 |
2.05 |
0.89 |
1.82 |
1.34 |
2.00 |
|
Weiblich |
gering |
2.11 |
2.49 |
1.59 |
2.47 |
1.31 |
1.98 |
1.49 |
2.23 |
mittel |
2.16 |
2.12 |
2.14 |
2.30 |
1.38 |
1.89 |
2.02 |
2.20 |
|
hoch |
2.44 |
2.07 |
2.43 |
2.26 |
1.77 |
1.82 |
2.34 |
2.13 |
|
Gesamt |
2.26 |
2.14 |
2.06 |
2.35 |
1.39 |
1.94 |
1.92 |
2.21 |
|
Gesamt (Geschlecht) |
gering |
1.60 |
2.14 |
1.33 |
2.33 |
1.09 |
1.98 |
1.23 |
2.14 |
mittel |
1.76 |
2.26 |
1.92 |
2.20 |
1.08 |
1.72 |
1.71 |
2.15 |
|
hoch |
2.23 |
2.03 |
2.46 |
2.01 |
1.44 |
1.81 |
2.21 |
2.01 |
|
Gesamt |
1.92 |
2.15 |
1.89 |
2.23 |
1.14 |
1.89 |
1.66 |
2.14 |
Anmerkung: N = 1134