Interne versus externe Validität
In der Diskussion der Vor- und Nachteile der Neuroleptika zweiter bzw. erster Generation werden von den Protagonisten, die gegen moderne Antipsychotika eine eher kritische Haltung einnehmen, gerne den „Wirksamkeitsstudien“ der Phase III, wie sie für die Arzneimittelzulassung durchgeführt werden, die sogenannten „Effectiveness“/„Real world“-Studien gegenübergestellt und Letztere als entscheidender bewertet. Es ist unbestritten, dass Phase-III-Studien unter anderem wegen der besonders strengen Selektion der Patienten im Hinblick auf verschiedene klinisch relevante Aspekte nicht in ausreichendem Maß generalisierbar sind: Sie haben eine hohe interne Validität, aber keine ausreichende externe Validität. Insofern war es schon lange Tradition innerhalb der klinischen Psychopharmakologie, dass solche Studien in komplementärer Weise ergänzt werden müssen durch Studien, die in stärkerem Maß an den alltäglichen klinischen Verhältnissen und Gegebenheiten orientiert sind, also Studien an Patienten, die eher den üblicherweise zu behandelnden Patienten entsprechen, dabei wurde allerdings immer betont, dass solche Phase-IV-Studien, z.B. im Rahmen von naturalistischen Anwendungsbeobachtungen, wegen ihrer immanenten Methodenprobleme, z.B. der Verzerrung der realen Gegebenheiten durch Nichtvorliegen von Blind- oder Doppelblindbedingungen, nur ein komplementärer Erkenntniswert zukommt und dass sie nicht die Ergebnisse von Phase- III-Studien falsifizieren können.
Drei Beispiele
Mit der derzeit verbreiteten hohen Wertschätzung von „Effectiveness“- Studien gerät diese aus methodologischer Sicht geradezu zwingende Konsequenz offensichtlich ins Wanken, und viele scheinen geneigt zu sein, diesen Studien einen höheren Erkenntniswert beizumessen als den methodisch stringenten Phase-III-Studien. Als Beispiel seien drei „Effectiveness“- Studien erwähnt, die derzeit von Kritikern der Vorteile der modernen Antipsychotika gerne als Beweis angeführt werden, dass die modernen Antipsychotika nicht den klassischen Antipsychotika überlegen sind. Es handelt sich um die folgenden Studien: CATIE (Lieberman et al., N Engl J Med 2005), CUTLASS (Jones et al., Arch Gen Psychiaty 2006) und die Studie von McCue et al. (British Journal of Psychiatry 2006). Alle drei Studien wurden interessanterweise hochrangig publiziert, obwohl sie erhebliche methodische Mängel aufweisen und obwohl die getroffenen Schlussfolgerungen angesichts dieser methodischen Mängel nicht haltbar sind, insbesondere nicht, wenn sie zur Falsifizierung der Phase-IIIStudien gemachten Ergebnisse dienen sollen. Gerade die CATIE-Studie hat eine Fülle von kritischen Kommentaren in der internationalen Literatur hervorgerufen (z.B. Möller, Eur Arch Psychiatry Clin Neurosci 2005; Kasper et al., World J Biol Psychiatry 2006; Fritze et al., Psychoneuro/in Druck; etc.). Die diesbezügliche Kritik kann hier nicht dargestellt werden, auf die zitierten Kommentare sei verwiesen. Auch die beiden anderen Arbeiten haben eine Reihe von Problemen, wie z.B. Nichtverblindung, fragwürdige Hauptzielparameter, problematische Patientenselektion im Sinne von stabilisierten, eher chronisch, partiell therapierefraktär Kranken (erkennbar an den minimalen Besserungsscores), fragwürdige Auswahl der als Neuroleptika der ersten Generation bezeichneten Medikamente (z.B. wurde bei einem Großteil der mit Substanzen der ersten Generation behandelten Patienten Sulpirid verordnet, was sicherlich normalerweise nicht in dieser Häufigkeit verordnet wird (z.B. Nichtberücksichtigung der Co-Medikation; vergleiche auch die Kritik der CUTLASS-Studie von Naber: Neurologie & Psychiatrie 2007). Es fragt sich, ob es in der CUTLASS-Studie überhaupt Hinweise für eine wirksame Therapie gibt. Ohne Plazebokontrolle lässt sich das angesichts der minimalen Besserungswerte nicht beurteilen. Eine Skizzierung zum Teil ähnlicher problematischer Aspekte der Studie von McCue et al. kann hier aus Platzgründen nicht vorgenommen werden. Kurzum, diese Studien lassen nicht nur erhebliche methodische Mängel erkennen, die per se eine gebiaste Wahrnehmung der Realität vermuten lassen, sondern in der CUTLASS-Studie scheint auch eine besondere Intention vorzuliegen, wenn z.B. Sulpidrid viel häufiger eingesetzt wird als unter normalen Routinebedingungen, offensichtlich um mit einem Quasi-Atypikum (Supirid steht dem Amisulprid sehr nahe) gute Ergebnisse im Typika-Arm zu produzieren. Diese Studien sind mit Sicherheit nicht geeignet, die Ergebnisse aus den methodisch stringenteren Phase-III-Studien infrage zu stellen. Es ist sogar die Frage zu stellen, ob sie besser die reale Versorgungssituation darstellen als Phase-III-Akut- und -Langzeitstudien, da sie offenbar ebenfalls eine selektive Patientenklientel einschließen, wenn auch die Selektion in eine andere Richtung geht.
Von Prof. Dr. Hans- Jürgen Möller, Psychiatrische Klinik, Ludwig-Maximilians- Universität München



