DeutschKlinik und Therapie

Die passende Normstichprobe bei der klinischen Diagnostik auswählen

Bei vielen psychologischen Tests stehen Normwerte für mehrere unterschiedliche Vergleichsgruppen bzw. Normstichproben zur Verfügung. Wenn dies der Fall ist, muss bei der Auswertung eines Tests entschieden werden, anhand welcher Normstichprobe die Normwerte bestimmt werden. Für diese Entscheidung ist die untersuchte diagnostische Fragestellung ausschlaggebend.
Jeder Normwert ist im Kern ein statistischer Kennwert. Ein und derselbe Normwert hat dabei definitionsgemäß immer die gleiche statistische Bedeutung: Er gibt an, wie ein individuelles Testergebnis in Bezug zur Normstichprobe einzuordnen ist. Es stehen verschiedene Arten von Normwerten zur Verfügung. Grob gesagt geben sogenannte Standardnormen Auskunft darüber, wie groß der Abstand eines individuellen Ergebnisses zum Mittelwert der Normstichprobe ist (bezogen auf die zugrundeliegende Standardabweichung). Prozentrangnormen geben an, wie viel Prozent der Proband:innen der Eichstichprobe denselben oder einen geringeren Rohwert erzielt haben.
Inhaltlich kann jedoch ein und derselbe Normwert eine sehr unterschiedliche Aussagekraft haben. Dies hängt davon ab, anhand welcher Normstichprobe er bestimmt wurde.

Typische Fragestellungen im klinischen Bereich

Fragestellungen im klinischen Bereich beziehen sich häufig darauf, ob eine bestimmte Erkrankung oder eine bestimmte Problematik vorliegt und falls ja, wie schwer diese ausgeprägt ist.
Die Diagnosestellung erfolgt in der Regel dadurch, dass die Kriterien entsprechender Klassifikationssysteme zu Rate gezogen werden (z. B. ICD-10 bzw. ICD-11 oder DSM-5). Sind die Kriterien erfüllt, wird die Diagnose gestellt. Normwerte von Tests liefern häufig wichtige Hinweise für die diagnostische Urteilsbildung. Entscheidend ist dabei die Auswahl der passenden Normstichprobe. Häufig findet man in den Manualen von Tests, die auf der Grundlage verschiedener Normstichproben geeicht wurden, spezifische Anleitungen dazu. Im Sinne der Interpretationsobjektivität sollten diese eingehalten werden. Zudem helfen folgende Überlegungen, eine Entscheidung zu treffen.

Repräsentative Normen oder klinische Normen?

Im klinischen Bereich stehen als Normstichproben häufig bevölkerungsrepräsentative Stichproben bzw. Feldstichproben und / oder klinische Stichproben mit spezifischen Patientengruppen zur Verfügung.
Bevölkerungsrepräsentative Normen oder Feldnormen geben Auskunft darüber, wie belastet eine Person im Vergleich zur Allgemeinbevölkerung ist. Diese Normen sind insbesondere aussagekräftig, wenn man wissen möchte, ob eine Person eine bestimmte Erkrankung (oder ein bestimmtes Problem) hat. Sie werden also häufig bei der Abklärung des Vorliegens einer Diagnose verwendet. In einigen Testmanualen werden hierfür auch Cut-off-Werte berichtet. Sind diese überschritten (je nach Polungsrichtung ggf. auch unterschritten), wird das als Hinweis auf das Vorliegen der Erkrankung oder Problematik interpretiert. Beispiele hierfür sind die Allgemeine Depressionsskala (ADS; Hautzinger et al., 2012) oder der Fragebogen zu Sozialer Angst und sozialen Kompetenzdefiziten (SASKO; Kolbeck & Maß, 2009).

Klinische Stichproben erlauben dagegen eher Rückschlüsse auf die Symptomstärke bzw. Problemstärke. Sie werden in der Regel erst dann herangezogen, wenn eine Diagnose bereits gestellt wurde, um festzustellen, wie ausgeprägt die Symptomatik relativ zu anderen Erkrankten ist. Wichtig ist es dabei sicherzustellen, dass eine zur Erkrankung der untersuchten Person passende klinische Stichprobe ausgewählt wird. Will man bspw. wissen, wie stark eine Depression ausgeprägt ist, sollte der Vergleich anhand einer Stichprobe depressiver Personen vorgenommen werden. Idealerweise sollten darin Personen mit unterschiedlichen Schweregraden depressiver Erkrankungen eingeschlossen sein. 

Man kann ein und denselben Testwert (Rohwert) nacheinander sowohl mit einer bevölkerungsrepräsentativen Norm (Feldnorm) als auch mit einer klinischen Stichprobe vergleichen. Bei psychisch kranken Personen ergibt sich häufig folgende Ergebniskonstellation: Der Normwert der repräsentativen Stichprobe bzw. Feldstichprobe ist höher als der Normwert der klinischen Stichprobe. Das ist kein Widerspruch. Im Beispiel könnte dies bedeuten, dass die Person im Vergleich zur Allgemeinbevölkerung überdurchschnittlich belastet ist, jedoch relativ zu anderen psychisch erkrankten Personen eine durchschnittliche Symptomausprägung aufweist. Nur bei schwer erkrankten Personen wird sowohl der Normwert der Feldnorm als auch der Normwert der klinischen Norm hoch ausfallen.
Es ist daher sehr wichtig, immer genau anzugeben, welche Normstichprobe verwendet wurde, wenn Normwerte an Außenstehende berichtet werden. Ein durchschnittlicher Normwert in Bezug auf eine Feldstichprobe bedeutet in der Regel eine viel niedrigere Symptombelastung (häufig gar keine Symptombelastung) als ein durchschnittlicher Normwert in Bezug auf eine klinische Stichprobe.

Es ist in der Regel davon abzuraten, Patient:innen mit klinischen Normstichproben zu vergleichen, welche nicht zum Erkrankungsbild der untersuchten Person passen. Beispielsweise sollten die Ergebnisse schizophrener Patient:innen nicht in Bezug zu einer Normstichprobe psychosomatischer Patient:innen gesetzt werden. Dies führt zu schwer interpretierbaren Ergebnissen.

Geschlechtsspezifische Normen oder Gesamtnormen?

Bei einigen Verfahren werden sowohl Gesamtnormen als auch geschlechtsspezifische Normen berichtet. Bei Letzteren wird zwischen Stichproben für Männer und Frauen oder Mädchen und Jungen unterschieden.
Die Verwendung geschlechtsspezifischer Normen kann sehr große Auswirkungen auf das Ergebnis haben. Dies ist immer dann der Fall, wenn bei dem untersuchten Störungsbild (der untersuchten Problematik) starke Geschlechtsunterschiede bestehen. In diesem Fall führt derselbe Rohwert zu deutlich unterschiedlichen Normwerten, je nachdem, ob die männliche oder weibliche Vergleichsstichprobe herangezogen wird.

Ein Beispiel hierfür ist die Computerspielabhängigkeit. Jungen bzw. Männer verbringen durchschnittlich mehr Zeit mit Computerspielen und weisen auch häufiger symptomatische Belastungen im Zusammenhang mit ihrem Spielverhalten auf als Mädchen bzw. Frauen (Rehbein et al., 2015, S. 41). Welche Auswirkungen dies auf die Interpretation von Normwerten hat, kann exemplarisch anhand der Computerspielabhängigkeitsskala (CSAS) (Rehbein et al. 2015) betrachtet werden:

Im Manual der CSAS findet sich auf Seite 41 folgender Hinweis: „Werden Rohwerte [der CSAS] geschlechtsspezifisch eingeordnet, gelten bei Mädchen/Frauen … bereits vergleichsweise niedrige Werte als überdurchschnittlich.“ Umgekehrt gelten „… bei Jungen/Männern vergleichsweise hohe Werte noch als durchschnittlich.“ 
Bei klinischen Verfahren ist bei der Verwendung geschlechtsspezifischer Normwerte allgemein festzuhalten: Hat die untersuchte Person das Geschlecht, welches im Durchschnitt stärker belastet ist, führen vergleichsweise hohe Rohwerte noch zu durchschnittlichen Normwerten. Hat die untersuchte Person das Geschlecht, welches im Durchschnitt weniger belastet ist, führen bereits vergleichsweise niedrige Rohwerte zu durchschnittlichen Normwerten.

Geschlechtsspezifische Normwerte sollten daher mit Umsicht verwendet werden: Sie sollten nicht „automatisch“ genutzt werden, nur weil sie vorhanden sind. Die Verwendung der Gesamtnorm kann u. U. angemessener sein. Dies gilt insbesondere dann, wenn das untersuchte Störungsbild nicht geschlechtsspezifisch definiert ist (wie bspw. eine Rechenstörung). Ein gestuftes Vorgehen ist auch hier möglich. Ein Rohwert kann sowohl mit der Gesamtstichprobe als auch der geschlechtsspezifischen Normstichprobe verglichen werden, um zu einem differenzierten Bild zu gelangen.

Altersspezifische Normen oder Gesamtnormen?

Für Altersnormen gelten ähnliche Überlegungen wie bei der Verwendung geschlechtsspezifischer Normwerte. Die Verwendung von Altersnormen beeinflusst das Ergebnis immer dann deutlich, wenn bei dem untersuchten Störungsbild (der untersuchten Problematik) starke Altersunterschiede bestehen. Dies trifft naturgemäß vor allem auf Kinder und Jugendliche zu, kann aber auch im Erwachsenenbereich gelten.

Bei Entwicklungstests ist es selbstverständlich notwendig, altersspezifische Normwerte zu verwenden, um bspw. Auffälligkeiten der sprachlichen Entwicklung festzustellen. Auch bei bestimmten Störungsbildern kann der Einsatz altersspezifischer Normwerte sinnvoll sein. Zum Teil werden von den Testautor:innen in diesem Fall ausschließlich altersspezifische Normwerte angegeben, sodass eine Entscheidung über die Nutzung einer evtl. ebenfalls vorhandenen Gesamtnorm entfällt. (Bei Kindern und Jugendlichen werden evtl. statt altersspezifischer Normwerte auch auf Schuljahrgänge bezogene Normwerte angegeben, insbesondere dann, wenn es sich im Falle von Leistungstests um Kompetenzen handelt, die weniger durch allgemeine Erfahrungen beim Älterwerden erworben werden, sondern spezifisch durch schulische Unterweisung, z. B. Schriftsprache oder Rechenfertigkeiten.)

Für die oben bereits erwähnte Computerspielabhängigkeit ist die Anwendung altersspezifischer Normwerte beispielsweise sehr sinnvoll. Das Spielverhalten ist unter Jugendlichen ausgeprägter als unter älteren Erwachsenen (Rehbein et al., 2015, S. 41). Der identische Rohwert führt daher bei Jugendlichen tendenziell zu niedrigeren Normwerten als bei Erwachsenen. Möchte man beispielsweise wissen, ob eine untersuchte 16-jährige Person relativ zu anderen Jugendlichen ihrer Altersgruppe besonders viel spielt, wird von den Autoren der CSAS empfohlen, die Normgruppe der Gleichaltrigen (bzw. die jahrgangsspezifische Norm für die 10. Klasse) heranzuziehen, und nicht den Vergleich mit der ebenfalls verfügbaren allgemeineren Norm der 16- bis 30-Jährigen vorzunehmen (Rehbein et al, 2015, S. 42).

Die Verwendung altersspezifischer Normen ist bei Störungsbildern mit starken Alterseffekten häufig sinnvoll. Man sollte sich jedoch bewusstmachen, dass derselbe Rohwert zu unterschiedlichen Normwerten führt, je nachdem, wie alt die untersuchte Person ist, und daher auch diese Entscheidung nicht „automatisch“ fällen.

Fazit

Die „richtige“ Norm ist diejenige, die zur Fragestellung passt. Nehmen Sie sich daher vor der Auswahl einer Normstichprobe die Zeit, Ihre Fragestellung genau zu formulieren. Anhand welcher Vergleichsstichprobe kann Ihre Frage am besten beantwortet werden? Der Normwert erlaubt ausschließlich einer Einordnung im Vergleich zu der ausgewählten Personengruppe und zu keiner anderen. Normen sind naturgemäß immer relative Werte: Die Schlussfolgerungen in Bezug auf die Symptomausprägung können bei ein und demselben Normwert je nach verwendeter Stichprobe sehr unterschiedlich sein. In vielen Testmanualen finden sich zudem Fallbeispiele und spezifische Hinweise, bei welcher Fragestellung welche Normstichprobe herangezogen werden soll.

 

Verwendete Literatur

Hautzinger, M., Bailer, M., Hofmeister, D. & Keller, F. (2012). Allgemeine Depressionsskala (ADS) (2., überarbeitete und neu normierte Auflage). Göttingen: Hogrefe.

Kolbeck, S. & Maß, R. (2009). Fragebogen zu Sozialer Angst und sozialen Kompetenzdefiziten (SASKO). Göttingen: Hogrefe.

Rehbein, F., Baier, D., Kleimann, M. & Mößle, T. (2015). Computerspielabhängigkeitsskala (CSAS). Göttingen: Hogrefe.

Dr. Anke Hensel

Dr. Anke Hensel studierte Psychologie an der Universität Leipzig und promovierte 2004. Sie war von 1999 bis 2005 in der Gedächtnisambulanz und von 2005 bis 2007 in der Forschungsabteilung Public Mental Health der Klinik und Poliklinik für Psychiatrie der Universität Leipzig als wissenschaftliche Mitarbeiterin tätig. Seit 2007 arbeitet sie nach Absolvierung eines Volontariats als Lektorin im Testlektorat des Hogrefe Verlages.

Hogrefe Diagnostik-Toolbox

Die smarte App für alle, die Tests einsetzen

Sie möchten Testergebnisse umrechnen und im Verhältnis zur Normalverteilung visualisieren oder in Vorbereitung für ein Gespräch leichter verständliche Prozentränge verwenden? Nutzen Sie für diese und weitere Anwendungsfälle die kostenfreie Hogrefe Diagnostik-Toolbox.

Das sagt der Dorsch zu:

Normierung [engl. standardization; lat. norma Regel, Maßstab], syn. Eichung, Standardisierung, [DIA], ein Nebengütekriterium (Gütekriterien) für diagn. Verfahren. Die Normierung ermöglicht eine relative, populationsbezogene Einordnung eines diagn. Wertes i. R. einer normorientierten Diagnostik (alternativ: Diagnostik, kriteriumsorientierte). Als Voraussetzung müssen gültige Normierungstabellen vorliegen: Diese dürfen nicht veraltet sein (z. B. max. 8 Jahre alt; Teststandards, DIN 33430) und müssen einer repräsentativen Normierungsstichprobe (Stichprobe) entstammen. ...

 

Dorsch - Lexikon der Psychologie Das Standardwerk bietet in ca. 13000 Einzelbeiträgen einen kompakten und verständlichen Überblick über die Entwicklung sowie das Grundlagen- und Anwendungswissen der Psychologie.