Die Herausforderung für DiGA-Hersteller:innen
Entwickler:innen einer Health App verfolgen oftmals eine großartige Idee, mit der sie ein gesellschaftlich relevantes Problem für eine gesundheitlich beeinträchtigte Zielgruppe lösen möchten. Nur Apps, für die Hersteller:innen positive Versorgungs- effekte für die anvisierte Zielgruppe nachweisen, können von Krankenkassen als sogenannte Digitale Gesundheitsanwendung (DiGA) verschrieben werden.
Für den Nachweis positiver Versorgungseffekte muss ein strenger Prüfprozess durchlaufen werden. Die Prüfung erfolgt durch das Bundesinstitut für Arzneimittel und Medizinprodukte (BfArM). Grundlage für die Antragstellung und Zulassung ist das sogenannte Fast-Track-Verfahren für digitale Gesundheitsanwendungen (DiGA) nach § 139e SGB V. Nach der Schaffung technischer Voraussetzungen für DiGA (z.B. Sicherheit und Funktionstauglichkeit, Datenschutz, Informationssicherheit, Interoperabilität und weitere Kriterien wie die Robustheit der App) muss der Nachweis positiver Versorgungseffekte anhand zweier empirischer Studien (Systematische Datenauswertung und Evaluationsstudie) erbracht werden. Dabei fordert das BfArM, dass ein herstellerunabhängiger wissenschaftlicher Dienstleister für die Realisierung dieser Studien federführend sein muss.
Als anerkannter Goldstandard in der klinischen Forschung gilt die randomisierte kontrollierte Studie (randomized controlled trial, RCT). Hier werden Patient:innen per Zufall in eine Interventions- und Kontrollgruppe eingeordnet. Auf diese Weise lässt sich empirisch überprüfen, ob die Behandlung im Vergleich zu einer Nicht-Behandlung (oder dem konventionellen Behandlungsansatz) einen positiven Effekt in Bezug auf vorab definierte Endpunkte hat (z.B. bessere Gesundheitsparameter, höheres Wohlbefinden).
Aus unserer Consulting-Praxis wissen wir, dass die Planung, Durchführung und Auswertung dieser Studien eine große Herausforderung darstellt und auf dem Weg zum Evidenznachweis jede Menge Stolperfallen lauern. Das große Problem ist, dass sich eine strategisch ungünstige Planung bzw. Konzeption der Studien oftmals erst später im Prozess zeigt – beispielsweise im Zuge der Datenauswertung. Im schlimmsten Fall wird die Aufnahme ins DiGA-Verzeichnis vom BfArM abgelehnt.
An dieser Stelle greifen wir in Form einer Checkliste wichtige Punkte auf, unter deren Berücksichtigung Hersteller:innen von Health Apps vermeidbare Fehler bei der Studienplanung einer RCT umgehen und den Grundstein für einen gelungenen Wirksamkeitsnachweis legen können.
Berücksichtigen Sie die richtigen Erfolgsmaße für den Nachweis des positiven Versorgungseffektes?
Als DiGA-Entwickler:innen fallen Ihnen vermutlich eine Vielzahl von potenziellen positiven Effekten ein, die die Nutzung der Anwendung mit sich bringen könnte. Tatsächlich gilt aber, dass die Erfolgsmaße passgenau auf die Inhalte Ihrer Health- App zugeschnitten sein sollten.
Zu viele Endpunkt führen ggf. dazu, dass durch das BfArM eine konservative statistische Auswertung zugrunde gelegt wird – das bedeutet vereinfacht gesagt, dass die Bedeutsamkeit bei vielen beobachteten Endpunkten verloren gehen kann.
Eine wichtige Unterscheidung ist dabei auch die Festlegung auf sogenannte primäre und sekundäre Endpunkte. Der primäre Endpunkt sollte unbedingt einen positiven Versorgungseffekt zeigen, während sekundäre Endpunkte den Wirksamkeitsnachweis zusätzlich unterstützen.
An einem Beispiel illustriert bedeutet das, dass wenn Ihre App beispielsweise Patient:innen mit Diabetes Typ 2 bei ihrer Lebensstiländerung unterstützen soll, liegt es näher, den Langzeitblutzucker-Wert (HbA1c) als primären Endpunkt („medizinischer Nutzen“) und darüber hinaus beispielsweise die Therapieadhärenz als sekundären Endpunkt („patientenrelevante Struktur- und Verfahrensverbesserungen“) zu definieren als andersherum.
Wägen Sie genau ab, welche positiven Versorgungseffekte Ihre Gesundheits- anwendung tatsächlich bewirken soll. Verzichten Sie darauf, zu viele Endpunkte zu erfassen – hier ist weniger oft mehr. Die systematische Datenauswertung liefert an dieser Stelle wichtige Informationen für die Evaluationsstudie.
Sind die ausgewählten Messinstrumente zur Messung der Endpunkte valide?
Wenn Sie die Entscheidung für Ihre Endpunkte getroffen haben, gilt es dieselben zu operationalisieren. Das bedeutet, dass die Endpunkte messbar gemacht werden müssen. Im Bereich der DiGA kommen häufig sogenannte „patient reported outcome measures“ (PROMs) zum Einsatz – zum Beispiel einen Fragebogen zur Einschätzung der individuellen Gesundheitskompetenz.
Um deren Einsatz zu rechtfertigen, müssen die Verfahren grundsätzlich valide sein. In der Regel bedeutet das, dass überzeugende empirische Befunde zum Verfahren und seiner psychometrischen Güte vorliegen müssen – einige Schlagwörter sind hier Objektivität, Reliabilität, dimensionale Validität, Konstrukt- und Kriteriumsvalidität.
Die fundierte Beurteilung entsprechender Gütekriterien erfordert Wissen und Erfahrung bzgl. Psychometrie und Testdiagnostik. Darin sind wir ausdrückliche Expert:innen.
Passen die ausgewählten Messinstrumente zu den Endpunkten?
Auch wenn ein Verfahren valide ist, ist es unter Umständen nicht passgenau für Ihre Fragestellung. Haben Sie beispielsweise eine sehr spezielle Zielgruppe (beispielsweise Brustkrebspatientinnen), so ist möglicherweise nicht die allgemeine, sondern die krankheitsspezifische Gesundheitskompetenz ausschlaggebend.
Allgemeine Testverfahren sind häufig zu unspezifisch - wählen Sie daher möglichst passgenaue Verfahren, die auf Ihre Zielgruppe passen.
Sind die ausgewählten Messinstrumente änderungssensitiv?
Darüber hinaus sollten Sie sich fragen, ob das Verfahren änderungssensitiv ist. Das bedeutet, dass das Verfahren in der Lage sein muss, die positiven Versorgungseffekte überhaupt abbildbar zu machen.
Inwieweit das Verfahren änderungssensitiv ist, hängt unter anderem davon ab, ob es sich um eher stabile Persönlichkeitseigenschaften handelt oder um veränderbare Einschätzungen. Im Optimalfall können Sie bereits auf wissenschaftliche Veröffentlichungen zurückgreifen, die in anderen Forschungs-kontexten zeigen konnten, dass das Verfahren änderungssensitiv ist.
Prüfen Sie bei Selbsteinschätzungen auch anhand der Fragen- bzw. Itemformulierungen, ob Sie durch die Intervention mit der Health-App begründeterweise eine positivere Einschätzung durch die Patient:innen erwarten.
Wählen Sie ein änderungssensitives Verfahren, um die positiven Versorgungseffekte Ihrer digitalen Gesundheitsanwendung nachweisbar machen zu können.
Haben Sie statistisch prüfbare Hypothesen für den Wirksamkeitsnachweis formuliert?
Mit der Formulierung von geeigneten Hypothesen legen Sie den Grundstein für die spätere statistische Datenauswertung bzw. -prüfung. Beachten Sie, dass mit der Hypothesenformulierung bereits vorab festgelegt wird, welche statistischen Prüfverfahren überhaupt in Frage kommen. Diese wiederum haben in der Praxis methodische Vor- und Nachteile und liefern unterschiedliche Aussagen. Daher gilt es hier, eine bewusste Entscheidung mit großer Tragweite für die Auswertung zu treffen.
Formulieren Sie statistisch eindeutig prüfbare Hypothesen (Null- und Alternativ- hypothese). Überlegen Sie bereits zu diesem Zeitpunkt, welche statistischen Verfahren daran anknüpfend in Frage kommen und welche Vor- und Nachteile diese mit sich bringen.
Zusammenfassung
Beachten Sie, dass die Checkliste selbstverständlich keinerlei Anspruch auf Vollständigkeit erhebt bzw. erheben kann. Jede DiGA-Antragstellung ist individuell. Wie so oft: Der Teufel steckt im Detail. Im DiGA-Prozess ergeben sich erfahrungsgemäß - beispielsweise in der Abstimmung der Studien mit dem BfArM - immer wieder neue inhaltliche wie methodische Aspekte, die es für eine erfolgreiche Studienplanung zu berücksichtigen gilt.
Gerne unterstützen wir Sie bei Fragen zur Studienplanung, -Durchführung und -auswertung. Kommen Sie auf uns zu!