Artikel
Krankheitskostenstudien auf Basis sehr großer Datenmengen: Relevanz der numerischen Effizienz eines innovativen Designs
Suche in Medline nach
Autoren
Veröffentlicht: | 27. August 2013 |
---|
Gliederung
Text
Im Gesundheitssektor fallen immer größere Mengen Routinedaten an. Diese stehen häufig auch für wissenschaftliche Analysen zur Verfügung. Dennoch wurde bislang kein spezielles Design entwickelt, um Krankheitskostenstudien auf Basis sehr großer Datenmengen durchzuführen. Wir präsentieren solch ein Design. Dieses zeichnet sich durch einen vergleichsweise geringen Informationsverlust aus. Darüber hinaus ist es numerisch effizienter als etablierte Methoden.
Die innovative Methode besteht aus fünf Schritten: Datenaggregation, Anpassung eines generalisierten additiven Modells (GAM), Kostenprädiktion, Vergleich prädizierter Kosten zwischen einer prävalenten und einer nicht prävalenten Population, Quantifizierung der stochastischen Unsicherheit via des Fehlerfortpflanzungsgesetzes.
Zur Demonstration der Methode, und um abzuschätzen, inwiefern der numerische Effizienzgewinn von praktischer Relevanz ist, wurde die innovative Methode auf einen Datensatz von 7,3 Millionen gesetzlich Krankenversicherten angewendet. Der numerische Aufwand war bei der innovativen Methode verhältnismäßig gering (19 Minuten Rechendauer). Bei Verzicht auf den Datenaggregationsprozess stieg nicht nur der Rechenaufwand exponentiell an; auch das Risiko, dass die Schätzung der Regressionsparameter fehlschlägt, war mit der Größe des Datensatzes assoziiert (80% bei einem GAM auf Basis von 6 Millionen Versicherten).
Der numerische Effizienzgewinn der empfohlenen Methodik zur Durchführung von Krankheitskostenstudien scheint von praktischer Relevanz zu sein. Darüber hinaus gewährleistet die innovative Methode eine effiziente Nutzung der verfügbaren Informationen.