gms | German Medical Science

186. Versammlung des Vereins Rheinisch-Westfälischer Augenärzte

Verein Rheinisch-Westfälischer Augenärzte

26.01. - 27.01.2024, Köln

Chat-GPT und die deutsche Facharztprüfung für Augenheilkunde: eine Evaluierungsstudie

Meeting Abstract

  • Michal Cieplucha - Düsseldorf
  • R. Yaïci - Düsseldorf
  • R. Bock - Düsseldorf
  • F. Moayed - Düsseldorf
  • G. Geerling - Düsseldorf
  • M. Roth - Düsseldorf

Verein Rheinisch-Westfälischer Augenärzte. 186. Versammlung des Vereins Rheinisch-Westfälischer Augenärzte. Köln, 26.-27.01.2024. Düsseldorf: German Medical Science GMS Publishing House; 2024. Doc24rwa21

doi: 10.3205/24rwa21, urn:nbn:de:0183-24rwa212

Veröffentlicht: 26. Januar 2024

© 2024 Cieplucha et al.
Dieser Artikel ist ein Open-Access-Artikel und steht unter den Lizenzbedingungen der Creative Commons Attribution 4.0 License (Namensnennung). Lizenz-Angaben siehe http://creativecommons.org/licenses/by/4.0/.


Gliederung

Text

Fragestellung: In der aktuellen Studie wurde die Eignung von Chat-GPT 4.0 im Bereich der Augenheilkunde analysiert.

Methoden: Ausgehend von einem Fragenkatalog mit 150 Fragen, der dem Standardwerk „1.000 Fragen Augenheilkunde“ entnommen wurde, erfolgte die Bewertung der Antworten, die Chat-GPT 4.0 generierte. Um eine präzise und fachspezifische Rückmeldung zu gewährleisten, wurde ChatGPT mittels eines Prompts angewiesen, die Funktion eines Facharztes für Augenheilkunde zu übernehmen. Ein Expertengremium aus 15 Augenärzten evaluierte die von dem Modell generierten Antworten hinsichtlich ihrer Richtigkeit, Themenrelevanz und inneren Kohärenz.

Ergebnisse: In unserer Studie hätte ChatGPT die Facharztprüfung in 12 von 15 Themengebieten bestanden. Betrachtet man die Gesamtauswertung, so hat Chat-GPT 4.0 in etwa 50% der Fälle korrekte Antworten generiert. Bemerkenswert ist, dass über 70% der Antworten eine hohe thematische Passgenauigkeit und Kohärenz aufwiesen, obwohl Chat-GPT 4.0 nicht speziell für medizinische Fragestellungen trainiert wurde. Auf den Gebieten Uveitis und Linse/Katarakt wurden 100% der Fragen richtig beantwortet.

Diskussion: Trotz des relativ bescheidenen Gesamtergebnisses, mit relativ weit gestreuten Ergebnissen je nach Spezialgebiet konnte das große Potenzial dieser Technologie herausstechen. Wenn zukünftige Iterationen des Modells speziell auf die Fachgebiete trainiert werden, so wird dies eine unentbehrliche Ressource in der medizinischen Praxis und Ausbildung darstellen können.