Psychologische Tests

Psychodiagnostik in

Psychologie und Psychotherapie

DYADE Praxislösungen

Qualität von Tests

 

Wissenschaftlichkeit

Alle hier verwendeten Tests sind Ergebnis von jahrzehntelanger Forschungsanstrengung der entsprechenden Autoren. Sie sind mit Fragebögen und "Tests" aus Zeitschriften oder Ratgebern nicht vergleichbar, da nur diese unverzichtbare wissenschaftliche Gütekriterien sicherstellen.

 

Hauptgütekriterien

Objektivität

Die Tests garantieren Objektivität auf allen Ebenen der Durchführung, der Auswertung und der Interpretation. Objektivität bedeutet, dass jeder testpsychologisch kompetente Anwender mit einem bestimmten Test an der gleichen Person zum selben Ergebnis kommen muss. Als testpsychologisch kompetent sind nur Diplom-Psychologen einzustufen, da nur das Studium der Psychologie entsprechende Kenntnisse vermittelt. Aus diesem Grund sind Psychologische Tests auch nicht frei verkäuflich, sondern sind Psychologen vorbehalten, die bei der Bestellung von Tests das Diplom nachweisen müssen. Einzige Ausnahme davon sind Schultests, die auch an Pädagogen abgegeben werden dürfen.

 

Reliabilität

Alle Tests erfüllen das Kriterium der Zuverlässigkeit, das heißt, dass die Tests statistisch bewiesen haben müssen, dass der Messwert auch wirklich der Testperson zuzuschreiben ist und nicht auf andere Einflüsse zurückgeht. Dieses wird in der Regel dadurch bestätigt, dass der Messwert einer Person bei wiederholter Messung unter möglichst unterschiedlichen Bedingungen stabil bleibt.

 

Validität

Die Validität beschäftigt sich schließlich damit, was Tests eigentlich messen. Diese Frage ist nicht so einfach zu beantworten, wie es scheint. Dazu müssen die Tests mit anderen Tests, die ähnliche oder andersartige Konstrukte messen, verglichen werden (Konstuktvalidität). Eine ängstliche Person sollte in verschiedenen Tests, die vorgeben, Ängstlichkeit messen wollen, ähnliche Ergebnisse haben. Da Tests Verhalten voraussagen sollen, sollten die Voraussagen auch mit Außenkriterien in Zusammenhang stehen (Kriteriumsvalidität). Ein Schultest sollte also zum Beispiel einen Teil des schulischen Erfolgs voraussagen können. Schließlich wird von einem Test noch verlangt, dass die Fragen oder Aufgaben inhaltlich repräsentativ für das daraus abgeleitete Konstrukt sind. Ein Test der Intelligenz misst, darf also nicht nur aus Aufgaben zum räumlichen Vorstellungsvermögen bestehen, sondern muss auch alle anderen Intelligenzbereiche mit erfassen.

 

Nebengütekriterien

Nebengütekriterien sind u.a. die Nützlichkeit und die Wirtschaftlichkeit des Verfahrens.

 

Normierung

Damit die Ergebnisse eines Tests interpretiert werden können bedarf es der Umrechnung des Rohwertes in einer Maßeinheit, die man sich vorstellen kann. Wenn Sie ein Grundstück kaufen möchten, würden Sie sich wahrscheinlich nicht mit der Information zufrieden geben, dass es die Länge 100 habe. Ohne die Angabe einer Längeneinheit wie m oder km, können Sie sich die Größe des Grundstückes nicht vorstellen. Wenn Sie erfahren, dass Sie in einem "Psychotest" einer Frauenzeitschrift 100 Punkte haben, sehen Sie nach, was diese 100 Punkte bedeuten. Trotz einer vielleicht literarisch interessanten Erläuterung bleibt jedoch die Frage offen, was dieser Wert in Bezug auf andere Personen bedeutet. Angenommen, dass in dem "Test" nicht mehr als 100 Punkte erreicht werden können. Lässt sich daraus bereits schließen, dass Sie im Vergleich zu anderen Personen eine besonders hohe Punktzahl haben? Leider nicht, denn ohne Angabe, wie viele Punkte man in dem "Test" erwarten kann, ist der Punktwert nicht aussagekräftig. Es kommt darauf an, wie sich die Ergebnisse von zufällig ausgewählten Testpersonen auf alle möglichen Punktwerte verteilen. Denn es macht einen Unterschied, ob die Wahrscheinlichkeit, in dem "Test" 100 Punkte zu erreichen 5, 50 oder vielleicht sogar 90 % beträgt. Während es einer Zeitschrift eher auf den Unterhaltenswert eines solchen "Psychotests" ankommt, muss ein Wissenschaftler zunächst die Wahrscheinlichkeiten aller möglichen Punktwerte berechnen, indem er die Aufgaben oder Fragen einer größeren repräsentativen Stichprobe vorgibt. Diese Stichproben bestehen in der Regel aus 500 bis 5000 Personen. Erst dann lässt sich die Verteilung der Rohwerte und ihre jeweilige Wahrscheinlichkeit zuverlässig ermitteln. Da die Angabe einer Wahrscheinlichkeit zu jedem Rohwert nicht sehr handlich ist, wird noch ein weiterer Schritt vollzogen. Die Rohwerte werden so umgerechnet, dass abhängig von der wahren Verteilung eine Verteilung entsteht, die bekannt ist. Eine solche gewohnte Verteilung ist die sogenannte Normalverteilung. Viele natürliche Merkmale verteilen sich bei genügend großer Stichprobe normal, d.h. symmetrisch und mit einem deutlichen Schwerpunkt in der Mitte (z.B. Schuhgrößen bei Männern). Das heißt, mittlere Werte (Schuhgrößen 41 bis 43) kommen am häufigsten vor, je weiter eine Schuhgröße nach oben oder unten von diesen mittleren Werten abweicht, desto kleiner wird die Anzahl derer, die diese Schuhgröße haben.

Es gibt verschiedene Normalverteilungen, die am häufigsten angewandten sind die Standard-Nine-Skala oder der Intelligenzquotient. Beiden Skalen ist gemeinsam, dass ein willkürlicher mittlerer Wert festgelegt wird, fünf bei der Stanine-Skala, einhundert beim Intelligenzquotienten. Danach wird die relative Breite der Verteilung festgelegt, die sogenannte Standardabweichung. Diese legt fest, wie viel Prozent der Testpersonen welchen Testwert bekommen sollen. So ist zum Beispiel durch eine Standardabweichung von 2 Punkten bei der Stanine-Skala festgelegt, dass etwa zwei Drittel der Testpersonen einen Testwert zwischen drei und sieben erreichen, das restliche Drittel erhält einen, zwei, acht oder neun Punkte. Durch diese Festlegung wird es möglich ohne Kenntnis der genauen Verteilung der Rohwerte eines Tests abschätzen zu können, ob eine Punktzahl hoch oder niedrig ist. Für jeden Testwert lässt sich genau sagen, wie häufig er vorkommt und somit ist die Frage beantwortet, wie viel Prozent der Menschen den gleichen oder einen niedrigeren Testwert erhalten würden.

 

Standard-Nine-Verteilung

20 %    
   
   
17 %        
       
       
       
       
12 %            
           
           
           
           
7 %                
               
               
4 %                    
                   
                   
                   
  1 2 3 4 5 6 7 8 9 Standard-
werte
Niedrige Werte Mittlere Werte Hohe Werte

 

Aus der Grafik ergeben sich die Werte für die prozentuale Verteilung der Punktwerte:

 

[ DYADE Praxislösungen ] [ DYADE - Praxis für Männer ]

[ Startseite ] [ Impressum ] [ Datenschutz ] [ Mail ] [ Links ] [ Banner ] [ Empfehlung ] [ Bewertung ] [ Sitemap ]