Prof. Dr. Hans-Jürgen Möller, München
“In summary, a systematic re-assessment of recent evidence across multiple meta-analyses on key mental disorders provided an overarching picture of limited additional gain for both psychotherapies and pharmacotherapies over placebo or TAU. A ceiling seems to have been reached with response rates < 50 % and most SMDs not exceeding 0.30–0.40.” [13]
Liest man dieses Resultat des Umbrella-Reviews und der metaanalytischen Evaluation rezenter Metaanalysen von Leichsenring et al. [13], einer bemerkenswert umfangreichen und offenbar methodisch sorgfältigen Untersuchung, so stellt man mit Erschrecken fest, dass auf der Basis der dargestellten Ergebnisse die Autoren zu dem Schluss kommen, dass die wichtigsten therapeutischen Verfahren der Psychiatrie in einem weiten Spektrum psychischer Störungen, u. a. depressive Störungen, Angststörungen, schizophrene Störungen, wenig wirksam sind, obwohl es sich ja zumindest bei den Psychopharmaka um sorgfältig, in einem streng national/europäisch und international reglementierten Verfahren der Wirksamkeitsprüfung zugelassene Medikamente handelt. Auch hatten Leucht et al. [16] in einem umfangreichen Review von Metaanalysen dargestellt, dass Psychopharmaka eine in weiten Bereichen vergleichbare Effektstärke haben wie viele Medikamente der Inneren Medizin: Für Psychopharmaka liegt der Großteil der Effektstärken bei einer standardisierten Mittelwertdifferenz [SMD] zwischen 0,2 und 0,5 (Mittelwert 0,49; 95%-Konfidenzintervall [KI] 0,41–0,47); für Internistika liegt der Großteil der Effektstärken zwischen 0,1 und 1,0 (Mittelwert 0,45; 95%-KI 0,37–0,57), wenn diese auch zu einem geringen Teil deutlich höhere Effektstärken erreichen.
Man wird erinnert an die Aufsehen erregenden Ergebnisse der Metaanalyse zur Wirksamkeit von damals neueren Antidepressiva (Fluoxetin, Paroxetin, Venlafaxin, Nefazodon) von Kirsch et al. im Jahr 2008 [12]. Die Autoren kamen zu dem sehr weit generalisierenden Ergebnis, dass die Wirksamkeit von Antidepressiva größtenteils klinisch irrelevant bzw. allenfalls bei sehr schweren Depressionen von klinischer Bedeutung sei. In dem Kontext wurde bereits damals diskutiert, ob diese Metaanalyse methodisch adäquat sei [9] und ob die benutzte, zu dem vernichtenden Ergebnis führende Definition von „klinisch relevant“ aus klinischer Sicht adäquat sei [20, 21] oder ob nicht gegebenenfalls eine andere Definition klinisch angemessener sei [23] und zu sinnvolleren Ergebnissen führe. Letzterer Aspekt spielt auch bei Leichsenring [13] in der zusammenfassen Diskussion eine Rolle (s. u.).
Interessanterweise liegen in der Arbeit von Leichsenring et al. die Resultate zur Effektgröße von Psychotherapie und Psychopharmakotherapie über alle Störungen (17 Entitäten) gerechnet in der gleichen Größenordnung, wenn man der Second-Order-Random-Effects-Metaanalyse die Effektgrößen der jeweils größten Metaanalyse zu den einzelnen Störungen zugrunde legt: Die SMD beträgt für Psychotherapie 0,34 (95%-KI 0,26–0,42) und für Psychopharmakotherapie 0,36 (95%-KI 0,32–0,41), jeweils beim Vergleich des jeweiligen Verfahrens mit Placebo oder der üblichen Therapie (TAU [treatment as usual]) [13]. Für „Head to Head“-Vergleiche von Psychotherapie und Pharmakotherapie (4 Entitäten) ergab sich eine SMD von 0,11. Für die Kombinationsbehandlung Psychotherapie plus Pharmakotherapie versus der jeweiligen Monotherapie (5 Entitäten) ist die SMD 0,31.
Zum besseren Verständnis der Ergebnisse noch einige weitere Angaben zum Umbrella-Review von Leichsenring et al.: Die Untersuchung bezog nach umfassender Literaturrecherche Metaanalysen ein, die zwischen 2014 und 2021 publiziert wurden und in denen
- Psychotherapie oder Pharmakotherapie mit Placebo oder TAU,
- Psychotherapie mit Pharmakotherapie „Head-to-Head“ oder
- die Kombination von Psychotherapie mit Pharmakotherapie zu jeweils einem von beiden
verglichen wurde.
Es wurden 102 Metaanalysen eingeschlossen, die 3782 randomisierte kontrollierte Studien (RCT) mit insgesamt 6 050 514 Patienten einbezogen. Die originären Untersuchungen bezogen sich auf depressive Störungen, Angststörungen, Zwangsstörungen, bipolare Störungen, schizophrene Störungen u. a. Die große Zahl von kontrollierten Studien und deren Verarbeitung in über 100 Metaanalysen ist bemerkenswert und übertrifft wahrscheinlich die Erwartung vieler Psychiater/Psychotherapeuten.
Kritische Gesundheitsökonomen könnten fragen, ob auf der Basis dieser Ergebnisse einer insgesamt als schwach beurteilten Wirksamkeit (s. o.) GKV und PKV noch die Behandlung mit Psychopharmaka/Psychotherapie bezahlen sollten. Deshalb ist das Ergebnis dieses Umbrella-Reviews mit den assoziierten ergänzenden Meta-Metaanalysen von hoher, gesundheitspolitischer Brisanz! Nachdem es sich aber um so lange schon bestehende und obendrein im Sinne der evidenzbasierten Medizin (EbM) leitlinienorientierte Therapien handelt, muss man auch die Gegenfrage stellen, ob die Ergebnisse des Umbrella-Reviews so überragende Validität besitzen, dass sie das umfangreiche bisherige klinische Wissen, wie es sich unter anderem in den diesbezüglichen EbM-gestützten Leitlinien darstellt, für irrelevant erklären können. Dieses klinische Wissen basiert ja nicht nur auf randomisierten Kontrollgruppen-Studien (RCTs), sondern auch auf anderen Quellen klinischer Erfahrung.
In dem Kontext sind zunächst einige grundsätzliche methodische Überlegungen zu Metaanalysen und Netzwerk-Metaanalysen, die die Datenbasis für den Umbrella-Review und die meta-metaanalytische Evaluation bilden, zu beachten. Metaanalysen und systematische Reviews werden in der evidenzbasierten Medizin als Basis für die Evidenzfindung angesehen. Dabei werden inhärente Probleme dieses methodischen Ansatzes oft nicht ausreichend berücksichtigt [19, 22]. In jüngster Zeit wird insbesondere den Netzwerk-Metaanalysen und den Umbrella-Reviews [10] zunehmend die Spitzenrolle in der Evidenzfindung zugewiesen, deren methodische Probleme aber ebenfalls in Rechnung zu stellen sind [8]. Es wurde zum Beispiel betont, dass die Netzwerk-Metaanalysen nur als deskriptiv anzusehen sind, da die Vergleiche zwischen den Behandlungen zugleich direkt und indirekt sind und dass die indirekten Vergleiche nicht randomisiert sind [1]. Ein weiterer kritischer Punkt ist, dass „Transitivität“ im Rahmen der Netzwerk-Metaanalyse nur für bekannte Modifikatoren kontrolliert werden kann, im Gegensatz zur Kontrolle aller Modifikatoren im Rahmen der Randomisierung. Deshalb ist es fragwürdig, ob Netzwerk-Metaanalysen wirklich dem höchsten Evidenzlevel entsprechen, wie von Leucht et al. vorgeschlagen [14], oder eher nicht, wie Faltinsen et al. [8] betonen.
Dies den weiteren Gedanken zugrunde legend, ist die Frage von Bedeutung, ob die Metaanalysen und Netzwerk-Metaanalysen alle methodisch korrekten und relevanten Publikationen berücksichtigen. Häufig werden zum Beispiel wichtige Publikation nicht einbezogen, weil sie an den starren, insbesondere von Cochrane vorgegebenen formalistischen Einschlussregeln der Metaanalysen scheitern. Hingewiesen sei in dem Zusammenhang auf Antidepressiva-Studien, die die Verblindung nicht, wie zum Beispiel von den Cochrane-Regularien gefordert, detailliert beschreiben, sondern als übliche Verfahrenstechnik der Psychopharmakologie voraussetzen. Allein dies kann dann zum Ausschluss einer Studie von der Metaanalyse führen, obwohl die Studie sonst methodisch in Ordnung ist und obendrein ein wichtiges Ergebnis präsentiert und gegebenenfalls sogar als Meilenstein-Studie anzusehen ist.
Man muss sich angesichts der numerischen Gleichheit der Ergebnisse für Psychopharmakotherapie und Psychotherapie weiter fragen, ob das Verfahren der Metaanalyse mit einem solchen Rauschen belastet ist, dass nicht ausreichend zwischen zwei völlig verschiedenen experimentellen Bedingungen differenziert werden kann. Alt ist auch die Diskussion, ob man überhaupt Metaanalysen zwischen Psychopharmakotherapie-Studien und Psychotherapie-Studien mit ihren völlig unterschiedlichen Rahmenbedingungen (s. u.) hinsichtlich des therapeutischen Ergebnisses metaanalytisch vergleichen kann [22].
Hinsichtlich der Bewertung der Ergebnisse von Leichsenring et al. [13] (für Psychopharmakotherapie-Studien und Psychotherapie-Studien) sei an die schon erwähnte Problematik der Definition von „klinischer Relevanz“ erinnert. Viele Autoren beziehen sich auf die statistische Effektstärke-Definition, wie sie Cohen 1988 [3] in einem ganz anderen Kontext auf der Basis von SMD-Kriterien vorgeschlagen hat: d = 0,2, d = 0,5, d = 0,8 für „small, medium and large effect sizes“ (diese entsprechen einer Number needed to treat [NNT] von 9, 4 oder 2). Diese Definitionen sind aber problematisch und werden der klinischen Realität nicht gerecht, wie auch Leichsenring et al. betonen [13]. Eine andere von Leichsenring et al. [13] vorgeschlagene Definition geht vom Konzept der minimalen klinisch relevanten Differenz (MCID [minimal clinical important difference]) aus [17, 18]; das wäre zum Beispiel für Depressionen auf der Basis der Depressivitätsbeurteilung mit der Hamilton-Depressionsskala (HAMD) eine Differenz von sieben HAMD-Punkten [7, 15], die bei klinischer Globalbeurteilung mit CGI (Clinical global impression) als ein (1) CGI-Unterschiedsgrad erkennbar ist. Die metaanalytisch gefundenen Effektstärken in der Größenordnung von 0,30, 0,40 oder sogar 0,50 entsprechen lediglich einer HAMD-Differenz von zwei oder vier Punkten, entsprechen damit nicht diesem MCID-Kriterium und wären nach Leichsenring et al. [13] nicht als klinisch relevant anzusehen. Offenbar ist das MCID-Kriterium zu idealistisch und definiert therapeutisch unerreichbare Idealwerte. Eine Definition wie die von Montgomery und Möller [23] vorgeschlagene ist demgegenüber der Datenbasis viel näher und führt zu einer positiveren Bewertung der in den kontrollierten Antidepressiva-Studien erreichten therapeutischen Effekte: Differenz von zwei MADRS-Punkten plus positive Responder-Analyse. Eine weitere Möglichkeit, klinische Relevanz auszudrücken, ist die Number needed to treat (NNT), die für Antidepressiva in der Größenordnung von 5 bis 7 angeben wird und damit üblichen, auch in der Inneren Medizin als klinisch relevant angesehenen Größenordnungen entspricht [16, 21].
Die Untersuchung von Leichsenring et al. [13] kommt für alle untersuchten Störungen insgesamt auf der Basis einer Second-Order-Random-Effect-Metaanalyse im Vergleich zu Placebo oder TAU zu einem Gesamtwert von SMD = 0,34 für Psychotherapie und von 0,36 für Psychopharmakotherapie – Werte, die hinsichtlich der einzelnen Störungsgruppen differenziert werden müssen. Beispielsweise ergab für die Behandlung der Depression (Major depressive disorder [MDD]) die größte Metaanalyse zur Psychotherapie (versus TAU) eine SMD von 0,31 [5]. Alle Studien berücksichtigend, ergaben sich Effektstärken, ausgedrückt als SMD, zwischen 0,11 und 0,61 für Psychotherapie versus Placebo oder TAU, die meisten Effektstärken waren kleiner als 0,50. Für die Psychopharmakotherapie der MDD ergab die größte Metaanalyse (eine Netzwerk-Metaanalyse) einen SMD-Wert von 0,30 [2]. Alle Studien berücksichtigend, ergaben sich Werte zwischen 0,19 und 0,41 für Psychopharmakotherapie versus Placebo.
Die Gleichheit der therapeutischen Ergebnisse für Psychopharmakotherapie und Psychotherapie in der Publikation von Leichsenring et al. [13], ähnlich auch in der jüngsten Responder/Remitter-bezogenen Netzwerk-Metaanalyse von Cuijpers et al. 2020 [6], ist bemerkenswert. Dieses Ergebnis bedarf aber der kritischen Hinterfragung. Ein Großteil der randomisierten Studien zur Psychotherapie ist im Gegensatz zu den Psychopharmaka-Studien nicht verblindet und Placebo-kontrolliert bzw. nicht in der Weise verblindet und Placebo-kontrolliert wie bei Psychopharmaka-Studien [4]. Obendrein folgt die Drop-out-Behandlung bei den Psychotherapiestudien meistens nicht der Stringenz, wie sie in Psychopharmakotherapie-Studien im Sinne von ITT-Analyse (Intention to treat) und LOCF-Analyse (Last observation carried forward) gegeben sind. Um dieses methodische Defizit, das die Ergebnisse von Psychotherapie-Studien positiv verzerrt, zu korrigieren, müsste man auch bei den Psychopharmakotherapie-Studien nur die Ergebnisse der OC(Observed cases)-Analysen verwerten. Ein Umbrella-Review und Second-Order-Metaanalysen wie von Leichsenring et al. 2022 [13] vorgelegt, die diese klinisch-methodischen Probleme nicht berücksichtigen, sind höchst problematisch. Die Feststellung „intention to treat data were preferred whenever available“ (Leichsenring 2022, Seite 134) löst das Problem nicht, sondern schafft eine eigenartige und fragwürdige Mischung der einbezogenen Studienergebnisse. Eine Ungleichbehandlung besteht auch darin, dass bei den Psychotherapiestudien die SMD bei der Second-Order-Metaanalyse auf der Basis von Studien im Vergleich zu Placebo (hat bei Psychotherapie Studien nicht die Stringenz wie bei Psychotherapiestudien!) oder TAU, bei den Psychopharmaka Studien aber im Vergleich zu Placebo berechnet wurde. Positiv ist, dass Leichsenring et al. Studien mit Wartelisten-Kontrollgruppen (dies sind in der Regel Psychotherapiestudien!) im Gegensatz zur Metaanalyse von Huhn et al. 2014 [11] ausgeschlossen haben, mit dem korrekten Hinweis, dass diese Studien zu einer Überbewertung des Effekts der Psychotherapie führen [13].
Wie gezeigt, ist eine differenzierte Betrachtung der Ergebnisse der Publikation von Leichsenring et al. 2022 [13] wichtig. Die dargestellten kritischen Überlegungen berücksichtigend, ist vielleicht das Ergebnis des Umbrella-Reviews samt der assoziierten Second-Order-Metaanalysen doch nicht so niederschmetternd, wie es zunächst scheint. Der kritische Punkt ist, welches Kriterium für klinische Relevanz bei der Beurteilung der Ergebnisse zugrunde gelegt wird.
Literatur
1. Cipriani A, Higgins JP, Geddes JR, et al. Conceptual and technical challenges in network meta-analysis. Ann Intern Med 2013;159:130–7.
2. Cipriani A, Furukawa TA, Salanti G, et al. Comparative efficacy and acceptability of 21 antidepressants for the acute treatment of adults with major depressive disorder. A systematic review and network meta-analysis. Lancet 2018;391:1357–66.
3. Cohen J. Statistical power analysis for the behavioral sciences. Lawrence Erlbaum 1988.
4. Cuijpers P, Karyotaki E, Anderson G, et al. The effects of blinding on the outcome of psychotherapy and pharmacotherapy for adult depression: a meta-analysis. Eur Psychiatry 2015;30:685–93.
5. Cuijpers P, Karyotaki E, Reijnders M et al. Was Eysenk right after all? A reassessment of the effects of psychotherapy for adult depression. Epidemiol Psychiatr Sci 2019;28:21–30.
6. Cuijpers P, Noma H, Karyotaki E, et al. A network meta-analysis of the effects of psychotherapies , pharmacotherapies and their combination in the treatment of adult depression. World Psychiatry 2020;19:92–107.
7. Duru G, Fantino B. The clinical relevance of changes in the Montgomery-Asberg Depression Rating Scale using the minimal clinically important difference approach. Curr Med Res Opin 2008;24:1329–35.
8. Faltinsen EG, Storebo OJ, Jakobsen JC, et al. Network meta-analysis: The highest level of evidence? BMJ Evid Based Med 2018;23:56–9.
9. Fountoulakis KN, Möller HJ. Efficacy of antidepressants: A reanalysis and re-interpretation of the Kirsch data. Int J Neuropsychopharmacol 2011;14:405–12.
10. Fusar-Poli P, Radua J. Ten simple rules for conducting umbrella reviews Evid Based Mental Health 2018;21:95–100.
11. Huhn M, Tardy M, Spineli LM. Efficacy of pharmacotherapy and psychotherapy for adult psychiatric disorder. A systematic overview of meta-analyses. JAMA Psychiatry 2014;71:706–15.
12. Kirsch I, Deacon BJ, Huedo-Medina TB, Scoboria A, et al. Initial severity and antidepressants benefits: a meta-analysis of data submitted to the FDA. PloS Med 2008;5:e45.
13. Leichsenring F, Steinert C, Rabelung S, Joannidis JPA. The efficacy of psychotherapies and pharmacotherapies in adults: an umbrella review and meta-analytic evaluation of recent meta-analyses. World Psychiatry 2022;21:133–45.
14. Leucht S, Chaimani A, Cipriani A, et al. Network meta-analyses should be the highest level of evidence in treatment guidelines. Eur Arch Psychiatry Clin Neurosci 2016;266:477–80.
15. Leucht S, Fennema H, Engel R, et al. What does the HAMD mean? J Affect Disord 2013;148:243–8.
16. Leucht S, Hierl S, Kissling W, et al. Putting the efficacy of psychiatric and general medicine medication into perspective: Review of meta-analyses. Br J Psychiatry 2012;200:97–106.
17. Man-Son-Hing M, Laupacis A, O’Rourke K, et al. Determination of the clinical importance of study results. J Gen Intern Med 2002;17:469–76.
18. McGlothin AE, Lewis R. Minimal clinical important difference: defining what really matters to patients. JAMA 2014;312:1342–3.
19. Maier W, Möller HJ. Meta-analysen. Methoden zur Evidenzmaximierung von Therapiestudien. Nervenarzt 2007;78:1028–36.
20. Moeller HJ. Isn’t the efficacy of antidepressants clinically relevant? A critical comment on the results of the metaanalysis by Kirsch et al. 2008. Eur Arch Psychiatry Clin Neurosci 2008;258:451–5.
21. Moeller HJ, Fountoulakis KN. Problems in determing the efficacy and effectiveness of antidepressants. Psychiatriki 2011;22:298–306.
22. Moeller HJ, Maier W. Evidence based medicine in Psychopharmacotherapy. Possibilities, problems, and limitations. Eur Arch Psychiatry Clin Neurosci 2010;260:25–39.
23. Montgomery SA, Möller HJ. Is the significant superiority of escitalopram compared to other antidepressants clinically relevant? Int Clin Psychopharmacol 2009;24:111–8.
Psychopharmakotherapie 2023; 30(01):1-4