I(tem) (R)esponse (T)heorie Ansatz

 

Anders als die KTT formuliert die Item Response Theorie (IRT) theoretische Annahmen darüber, wie Personenmerkmale, formale Itemmerkmale und weitere nicht geprüfte Faktoren das manifeste Antwortverhalten beeinflussen. Danach hängt die Wahrscheinlichkeit, dass eine Person ein Item positiv in die interessierende, d.h. die Schlüsselrichtung eines Konstrukts beantwortet, ab 1) von der Ausprägung der Person auf der LV, d.h. vom Personenparameter, 2) von formalen Eigenschaften des Items wie seiner Schwierigkeit und Trennschärfe sowie 3) von nicht erfassten systematisch oder zufällig wirksamen Faktoren. Nach der Anzahl als frei variierend modellierter Itemparameter werden verschiedene, hierarchisch genestete, d.h. zunehmend weniger restringierte Modellklassen (zsf. z.B. Rost, 2004) unterschieden, deren Gültigkeit gegeneinander getestet werden kann. Die bekannteste ist das im europäischen Raum häufig favorisierte Rasch Modell. Es lässt nur die Variation der Itemschwierigkeiten zu und wird deshalb auch als 1 (Item) Parameter Modell bezeichnet. Das auf Birnbaum (in Lord & Novick, 1968) zurückgehende 2 (Item) Parameter Modell erlaubt zusätzlich variierende Trennschärfen bzw. Faktorladungen. 3 (Item) Parametermodelle erfassen zusätzlich Antwortratewahrscheinlichkeiten.

Der durch IRT Modelle formalisierte nicht lineare Zusammenhang zwischen Faktoren bzw. latenten Variablen (LV) und Items bzw. manifesten Indikatoren kann entweder durch eine logistische oder durch eine kumulative Normalverteilungsfunktion modelliert werden. Beide gewährleisten, dass die Antwortwahrscheinlichkeiten auch für binäre Items immer zwischen 0 und 1 liegen. Takane und de Leeuw (1987) zeigten erstmals (zsf. Glöckner-Rist & Hoijtink, 2003), dass die Parameter eines multidimensionalen 2 Parameter Normalogivenmodell wie die Parameter linearer FA Modelle interpretierbar sind. D.h. auch in diesem Modell wird für jede Person ein Faktorwert berechnet und für jedes Item ein Trennschärfeparameter bzw. eine Faktorladung für jede LV. Für jedes Item wird jedoch nur ein Schwierigkeits- bzw. Schwellenwert bestimmt. Ansonsten wäre das Modell nicht identifiziert. Die parallel entwickelten logistischen IRT Modelle ermitteln die bedingten Antwortwahrscheinlichkeiten durch Integration über die logistische Verteilung statt über die Normalverteilung. Beide Modellklassen unterscheiden sich jedoch nur dadurch, dass die Trennschärfen nach logistischen Modellen ungefähr 1.7 mal höher sind als die durch Normalogivenmodelle bestimmten.

Beide Modellvarianten wurden in einen verallgemeinerten Strukturgleichungsansatz (Múthen, 2002) integriert, der erheblich erweiterte und flexiblere Analysemöglichkeiten für binäre und kategoriale Daten auch als traditionelle IRT Modelle bietet (zsf. Glöckner-Rist & Hoijtink, 2003). Er ist über das hier eingesetzte Programm Mplus (Múthen & Múthen, 2005) nutzbar. Das Normalogivenmodell hat dabei den praktischen Vorteil, keine Integration zu erfordern und somit häufig sehr viel schneller berechnet werden zu können.