Affiliation:
1. Sportwissenschaftliches Institut der Universität des
Saarlandes, Saarbrücken
Abstract
ZusammenfassungBei der Darstellung von Testverfahren für den Gesundheitssport und die
Sporttherapie erfolgt weitestgehend eine Orientierung an den Haupt- und
Nebengütekriterien: Objektivität, Reliabilität und
Validität bzw. Normierbarkeit und Ökonomie. In der Medizin und
auch in der Physiotherapie werden darüber hinaus auch Maßzahlen
der diagnostischen Güte genannt. Es geht um die Frage, wie gut ein
Testverfahren Personen mit bzw. ohne Auffälligkeiten oder
Schwierigkeiten unterscheiden kann. Dies zu klären, ist die Aufgabe von
Diagnosestudien. In der einschlägigen eher sozialwissenschaftlich
orientierten Testliteratur werden Maße der diagnostischen Güte
im Gegensatz zum medizinisch-therapeutischen Milieu kaum thematisiert.Am Beispiel des FAHW-12, eines Screening-Tests zur Beurteilung des Wohlbefindens,
wird aufgezeigt, welche Maße der diagnostischen Güte von
Bedeutung sind und wie sie bestimmt werden können.Am häufigsten werden die Sensitivität und Spezifität
genannt. Diese Werte werden über sog. Vierfeldertafeln berechnet. Beide
Werte bedingen sich gegenseitig negativ. Eine Erhöhung der
Sensitivität geht immer zu Lasten der Spezifität und umgekehrt.
Bei einer maximalen Sensitivität eines Tests werden fast alle Patienten
als krank klassifiziert. Dann werden aber auch sehr viele Gesunden als krank
eingestuft. Die Diagnose hat also eine sehr geringe Spezifität. Wird
hingegen umgekehrt fast niemand als krank eingestuft, dann werden aber auch sehr
viele Kranke als gesund eingestuft. Die Diagnose hat also eine sehr geringe
Sensitivität. Diese gegenseitige Abhängigkeit von
Sensitivität und Spezifität wird vor allem bei einer grafischen
Darstellung deutlich.Da bei der Beurteilung von Sensitivität und Spezifität jeweils
nur Auffällige oder Unauffällige in den Blick genommen werden,
werden auch andere komplexere Gütemaße, wie z. B. der
RATZ-Index, beleuchtet.Eine weitere wichtige Aufgabe von Diagnosestudien besteht darin, den sog.
Trennpunkt zu bestimmen. Das ist der Testwert, der optimal Personen mit von
solchen ohne Störung bzw. Krankheit differenziert. Eine
Möglichkeit hierfür stellt der Youden-Index dar. Des Weiteren
kann die ROC-Kurve zur Beantwortung dieser Frage herangezogen werden.Spezielle Probleme ergeben sich, wenn die Referenzwerte, der sog. Goldstandard,
nicht in dichotomer Form, sondern als Ordinal- oder Intervallskalen vorliegen.
Dann müssen die Personen anhand definierter Cut-Off-Werte als
auffällig bzw. unauffällig klassifiziert werden.
Reference24 articles.
1. Testtheorie, Testkonstruktion, Testevaluation
2. Handbuch Motorische Tests
3. FAHW-12 – ein Screeningtest zur Erfassung des Wohlbefindens;G. Wydra;Bewegungstherapie und Gesundheitssport,2014