Prof. Dr. Hans-Peter Volz, Werneck
Kirsch et al. [1] zeigten in einer – auch in der Laienpresse – viel beachteten Metaanalyse randomisierter, Placebo-kontrollierter Zulassungsstudien, dass Antidepressiva nur bei schwereren Depressionsgraden eine von Placebo unterschiedliche Wirkung aufweisen. Das führte zum Teil zu Aussagen wie, Antidepressiva seien nur Placebos, und verunsicherte viele Patienten, die Antidepressiva einnahmen, aber auch verordnende Kollegen. Eine breite Diskussion schloss sich hier an, in zahlreichen Leitlinien wurde letztendlich die Aussage, dass Antidepressiva bei leichteren Depressionsgraden nicht wirkten, übernommen.
Kirsch et al. stellten in ihrer Metaanalyse eine Beziehung her zwischen dem initialen Schweregrad (gemessen mit dem Summenwert der Hamilton-Depressionsskala [HAMD]) und der Besserung im Therapieverlauf im Vergleich zu Placebo (ebenfalls mit dem Summenwert der HAMD gemessen). Die jetzt vorliegende Untersuchung näherte sich dieser Fragestellung auf einem methodisch ungleich höheren Niveau: Eingeschlossen wurden hier alle auf Patientenebene erhobenen Daten der industriegesponserten, Placebo-kontrollierten Akutstudien, die mit Citalopram, Paroxetin oder Sertralin durchgeführt wurden und die 17-Item-HAMD als Effektivitätsparameter verwendeten. Diese Stichprobe umfasste 8262 Patienten aus 28 Studien. Die Patienten wurden in drei Gruppen eingeteilt:
- Nicht-schwere Depression (HAMD-17-Summenscore ≤ 18), n = 654
- Schwere Depression (HAMD-17-Summenscore ≥ 27), n = 1377
- Mittelschwere Depression (HAMD-17-Summenscore zwischen 19 und 26), n = 6231
Die Effektivität wurde nicht nur mit dem HAMD-17-Summenscore ausgewertet, sondern auch mit einem Subscore aus sechs Items (HAMD-6), der die depressive Kernsymptomatik widerspiegelt (depressive Stimmung, Schuldgefühle, Beeinträchtigung der Arbeit und Aktivitäten, psychomotorische Verlangsamung, psychische Angstsymptome, allgemeine körperliche Angstsymptome), sowie mit dem HAMD-Item 1 „depressive Stimmung“. Zusätzlich wurde ein Subscore mit den elf Items jenseits der depressiven Kernsymptomatik ausgewertet (Non-HAMD-6).
Studienergebnis
Der Unterschied zwischen Placebo und Verum nahm bei Verwendung des HAMD-17-Gesamtscores als Effektivitätsparameter bei zunehmender Depressionsschwere zu (im Sinne des Ergebnisses der Studie von Kirsch et al., [1]). Hingegen war dies bei Verwendung der beiden anderen Parameter (HAMD-6, HAMD-Item 1) nicht der Fall, aber deutlich bei Verwendung des Non-HAMD-6-Scores (Abb. 1; HAMD-1-Wert nicht dargestellt).
Abb. 1. Abhängigkeit des Unterschieds Verum – Placebo von der initialen Depressionsschwere (gemessen mit dem HAMD-17-Summenwert). Dargestellt sind die Mittelwerte der erreichten Endpunkt-Scores: a) Endpunkt ebenfalls mit dem HAMD-17-Summenwert gemessen (ausgeschlossen von dieser Analyse wurden extreme Ausreißer); b) Endpunkt HAMD-6-Subscore (depressive Kernsymptomatik; die depressive Stimmung allein [HAMD-Item 1] zeigte einen ähnlichen Verlauf [nicht gezeigt]); c) Endpunkt Non-HAMD-6-Subscore (mod. nach [Hieronymus et al.]); HAMD: Hamilton-Depressionsskala
Welche Items „treiben“ nun den Unterschied zwischen Verum und Placebo, wenn der HAMD-17-Gesamtwert verwendet wird? Dieser Frage wurde in einer Einzel-Item-Analyse mit Auswertung der Effektstärken nachgegangen. Dabei zeigte sich, dass die Items der HAMD-6 in der leicht depressiven und der schwer depressiven Gruppe ähnlich stark gebessert wurden. Dagegen wurden vor allem die Schlafitems, Agitation und somatische Symptome in der wenig depressiven Gruppe kaum gebessert (oder verschlechtern sich sogar), während sie sich in der schwer depressiven Gruppe deutlich besserten (Abb. 2). Diese Items waren aber auch zur Baseline bei der leicht depressiven Gruppe deutlich geringer ausgeprägt als bei der schwer depressiven Gruppe, sodass sie sich gar nicht deutlich bessern konnten (Deckeneffekt).
Abb. 2. Effektstärken der antidepressiven Therapie (im Vergleich zu Placebo) in Bezug auf die Non-HAMD-6-Items bei Patienten mit nicht schwerer vs. schwerer Depression (nicht schwere Depression: Baseline-HAMD-17 ≤ 18; schwere Depression: Baseline-HAMD-17 ≥ 27); * p < 0,05 (mod. nach [Hieronymus et al.]). Bei der depressiven Kernsymptomatik (HAMD-6) ergaben sich hingegen in beiden Patientengruppen gleichsinnige Veränderungen (nicht gezeigt).
Eine Schlussfolgerung der Autoren: Die von viele Autoren beschriebene Prädiktion eines geringen Placebo-Verum-Unterschieds bei leichter Depression rührt daher, dass als Haupt-Wirksamkeitsparameter ein Instrument verwendet wurde, bei dem zahlreiche Items außerhalb der Kernsymptomatik der Depression bei den leicht Depressiven eine geringe Ausprägung hatten und sich so, im Gegensatz zu schwer Depressiven, gar nicht bessern konnten, während es in Bezug auf die Kernsymptomatik der Depression keinen Unterschied der Wirksamkeit von Antidepressiva bei leicht oder schwer Depressiven gibt.
Kommentar
Dies ist eine überaus interessante Studie. Sie legt, überspitzt formuliert, nahe, dass die Resultate von Kirsch et al. darauf beruhen, dass es einen deutlichen Effektunterschied in Abhängigkeit von der Ausgangsschwere der Depression bei HAMD-Items gibt, die nicht die Kernsymptomatik der Depression beschreiben, aber eben nicht bei der depressiven Symptomatik an sich. Die Schlussfolgerung der Analyse von Kirsch et al. ist also letztendlich einem Artefakt der verwendeten Skala geschuldet.
In der Diskussion verweisen die Autoren zu Recht, wie auch der Kommentator dieser Studie, Furukawa, darauf, dass eine Reihe anderer Studien ein ähnliches Resultat wie Hieronymus et al. fanden, aber auch ähnliche wie Kirsch et al.
Falls diese Ergebnisse bestätigt werden sollten, ist das rasch übernommene Paradigma, dass Antidepressiva bei leichteren Depressionen keine von Placebo unterschiedliche Wirksamkeit erzielen können, nicht mehr zu halten. Es wäre schön, aber wohl eine illusorische Annahme, wenn diese Studie eine ähnlich breite Rezeption erführe wie jene von Kirsch vor elf Jahren, auch in der Laienpresse.
Interessenkonflikterklärung
Prof. Volz erklärt folgende potenzielle Interessenkonflikte aus den letzten zwei Jahren:
Beratungen: Lundbeck, Pfizer Pharma, Dr. Willmar-Schwabe, Bayer Vital, Janssen-Cilag, Otsuka Pharma Deutschland, neuraxpharm, Recordati Deutschland
Vorträge: Lundbeck, AstraZeneca, Pfizer Pharma, Dr. Willmar-Schwabe, Bayer Vital, Lilly Deutschland, Janssen-Cilag, Servier Deutschland, Dr. Pfleger Arzneimittel
Aktien: Novartis
Quellen
Hieronymus F, et al. Influence of baseline severity on the effects of SSRIs in depression: an item-based, patient-level post-hoc analysis. Lancet Psychiatry 2019;6:745–52.
Furukawa TA. Baseline severity and efficacy of antidepressants: into the third generation of research. Lancet Psychiatry 2019;6:715–6.
Literatur
1. Kirsch I, et al. Initial severity and antidepressant benefits: a meta-analysis of data submitted to the Food and Drug Administration. PLoS Med 2008;5:e45.
Psychopharmakotherapie 2019; 26(06):341-349