I(tem) (R)esponse (T)heorie Ansatz
Anders als die KTT formuliert die Item
Response Theorie (IRT) theoretische Annahmen darüber, wie Personenmerkmale,
formale Itemmerkmale und weitere nicht geprüfte
Faktoren das manifeste Antwortverhalten beeinflussen. Danach hängt die
Wahrscheinlichkeit, dass eine Person ein Item positiv in die interessierende,
d.h. die Schlüsselrichtung eines Konstrukts beantwortet, ab 1) von der Ausprägung
der Person auf der LV, d.h. vom Personenparameter, 2) von formalen
Eigenschaften des Items wie seiner Schwierigkeit und Trennschärfe sowie 3) von
nicht erfassten systematisch oder zufällig wirksamen Faktoren. Nach der Anzahl
als frei variierend modellierter Itemparameter werden
verschiedene, hierarchisch genestete, d.h. zunehmend weniger restringierte
Modellklassen (zsf. z.B. Rost, 2004) unterschieden,
deren Gültigkeit gegeneinander getestet werden kann. Die bekannteste ist das im
europäischen Raum häufig favorisierte Rasch Modell. Es lässt nur die Variation
der Itemschwierigkeiten zu und wird deshalb auch als
1 (Item) Parameter Modell bezeichnet. Das auf Birnbaum (in Lord & Novick,
1968) zurückgehende 2 (Item) Parameter Modell erlaubt zusätzlich variierende
Trennschärfen bzw. Faktorladungen. 3 (Item) Parametermodelle erfassen
zusätzlich Antwortratewahrscheinlichkeiten.
Der durch IRT Modelle
formalisierte nicht lineare Zusammenhang zwischen
Faktoren bzw. latenten Variablen (LV) und Items bzw. manifesten Indikatoren
kann entweder durch eine logistische oder durch eine kumulative
Normalverteilungsfunktion modelliert werden. Beide gewährleisten, dass die
Antwortwahrscheinlichkeiten auch für binäre Items immer zwischen 0 und 1
liegen. Takane und de Leeuw
(1987) zeigten erstmals (zsf. Glöckner-Rist & Hoijtink, 2003), dass die Parameter eines
multidimensionalen 2 Parameter Normalogivenmodell wie
die Parameter linearer FA Modelle interpretierbar sind. D.h. auch in diesem
Modell wird für jede Person ein Faktorwert berechnet und für jedes Item ein
Trennschärfeparameter bzw. eine Faktorladung für jede LV. Für jedes Item wird
jedoch nur ein Schwierigkeits- bzw. Schwellenwert bestimmt. Ansonsten wäre das
Modell nicht identifiziert. Die parallel entwickelten logistischen IRT Modelle
ermitteln die bedingten Antwortwahrscheinlichkeiten durch Integration über die
logistische Verteilung statt über die Normalverteilung. Beide Modellklassen
unterscheiden sich jedoch nur dadurch, dass die Trennschärfen nach logistischen
Modellen ungefähr 1.7 mal höher sind als die durch Normalogivenmodelle bestimmten.
Beide Modellvarianten wurden in einen
verallgemeinerten Strukturgleichungsansatz (Múthen,
2002) integriert, der erheblich erweiterte und flexiblere Analysemöglichkeiten
für binäre und kategoriale Daten auch als traditionelle IRT Modelle bietet (zsf. Glöckner-Rist & Hoijtink,
2003). Er ist über das hier eingesetzte Programm Mplus
(Múthen & Múthen, 2005)
nutzbar. Das Normalogivenmodell hat dabei den
praktischen Vorteil, keine Integration zu erfordern und somit häufig sehr viel
schneller berechnet werden zu können.