Artikel
Objektive und automatische Ermittlung der Verständlichkeit von Kindern und Jugendlichen mit Lippen-Kiefer-Gaumenspalten
Automatic evaluation of intelligibility of children and adolescents with cleft lip and palate
Suche in Medline nach
Autoren
Veröffentlicht: | 5. September 2006 |
---|
Gliederung
Zusammenfassung
Bei Kindern mit Lippen-Kiefer-Gaumenspalten können trotz adäquater chirurgischer Behandlung Lautbildungsstörungen auftreten, die die Verständlichkeit einschränken. Die übliche subjektive, auditive Bewertung der Verständlichkeit ist für klinische und wissenschaftliche Zwecke nur bedingt geeignet. Objektive Verfahren existieren bisher nicht.
Im Rahmen der interdisziplinären Spaltsprechstunde wurden Sprachaufnahmen von 31 Kindern und Jugendlichen mit Lippen-Kiefer-Gaumenspalten im Alter 10,1 ± 3,8 Jahren mit unterschiedlichen Spaltformen aufgezeichnet. Die Aufnahmen entstanden bei der Durchführung eines standardisierten Tests zur Lautbildung. Basierend auf der automatischen Spracherkennungstechnik wird zur objektiven Sprechanalyse der prozentuale Anteil der richtig erkannten Wörter ermittelt, die „Wortakkuratheit“. Zum Vergleich erfolgt die subjektive Bewertung der Verständlichkeit der Sprachaufnahmen durch 3 Experten.
Die automatische Bewertung ergibt eine Wortakkuratheit von 1,2% bis 75,8% (48,0% ± 19,6%). Die subjektive Bewertung der Sprachverständlichkeit durch die Experten zeigt eine hohe Übereinstimmung mit der automatischen Bewertung (p<0,01).
Die automatische Spracherkennung ist eine geeignete objektive Methode, um die Sprachverständlichkeit zu quantifizieren. Sie kann die Ermittlung des Einflusses verschiedener Sprechstörungen auf die Verständlichkeit verbessern sowie zur genauen Erfassung der Ergebnisqualität verschiedener therapeutischer Konzepte dienen.
Text
Hintergrund
Bei Kindern mit Lippen-Kiefer-Gaumenspalten können trotz adäquater chirurgischer Behandlung Lautbildungsstörungen auftreten. Dabei handelt es sich neben den üblichen Lautbildungsstörungen vor allem um eine vermehrte nasale Luftführung, eine Verlagerung der Artikulation oder veränderte Artikulationsspannung. Dies bedingt eine Einschränkung der Verständlichkeit und damit der kommunikativen Kompetenz der Betroffenen. Lautbildungsstörungen und die Verständlichkeit werden üblicherweise bisher subjektiv auditiv bewertet. Naturgemäß unterliegt die subjektive Bewertung der Verständlichkeit jedoch interindividuellen und intraindividuellen Schwankungen und ist damit für klinische und wissenschaftliche Zwecke nur bedingt geeignet. Objektive Verfahren zur Quantifizierung der Verständlichkeit existierten bisher nicht. In diesem Beitrag wird eine neue Methode zur objektiven Ermittlung der Verständlichkeit [Ref. 1] von Kindern und Jugendlichen mit Lippen-Kiefer-Gaumenspalten vorgestellt.
Patienten und Methode
Im Rahmen der interdisziplinären Spaltsprechstunde wurden Sprachaufnahmen von 31 Kindern und Jugendlichen mit Lippen-Kiefer-Gaumenspalten im Alter 10,1 ± 3,8 Jahren mit unterschiedlichen Spaltformen aufgezeichnet. Die Aufnahmen entstanden bei der Durchführung des PLAKSS (Psycholinguistische Analyse kindlicher Sprechstörungen) [Ref. 2]. Für die objektive Bewertung der Verständlichkeit wurde ein Spracherkennungssystem verwendet, das am Lehrstuhl für Mustererkennung der Universität Erlangen entwickelt wurde. Das Spracherkennungssystem analysiert gesprochene Sprache, in dem es diese erst in kleine Zeiteinheiten unterteilt und deren spektrale und temporalen Eigenschaften mit einem internen „Wörterbuch“ vergleicht, welches zuvor durch ein Training des Systems mit vielen Sprachaufnahmen aufgebaut wird. Jedes Wort wird durch eine Sequenz von Hidden Markov Modellen repräsentiert, welche jeweils die Wahrscheinlichkeit wiedergeben, mit der ein akustisches Signal mit einem bekannten Phonem übereinstimmt. Damit werden die Wörter ermittelt, welche mit größter Wahrscheinlichkeit mit den gesprochenen Wörtern übereinstimmen. Die Bewertung der Verständlichkeit durch die automatische Spracherkennungstechnik basiert dann auf der Ermittlung des Anteils der korrekt erkannten Wörter einer Wortfolge in Prozent, der sogenannten Wortakkuratheit. Zur genauen Bestimmung der Wortakkuratheit ist eine Verschriftung der Sprachaufnahmen notwendig.
Zum Vergleich der automatischen Bewertung erfolgt die subjektive Bewertung der Verständlichkeit der Sprachaufnahmen durch 3 Experten. Hierbei wird die Verständlichkeit auf einer Likert-Skala von 1 (sehr gut verständlich) bis 5 (sehr schlecht verständlich) angegeben.
Ergebnisse
Die automatische Bewertung ergibt eine Wortakkuratheit von 1,2% bis 75,8% (48,0% ± 19,6%). Die subjektive Bewertung der Sprachverständlichkeit durch die Experten zeigt eine hohe Übereinstimmung mit der automatischen Bewertung (p<0,01), s. Abbildung. Die Analyse der Übereinstimmung zwischen den Experten mittels Multi-Rater Kappa ist ähnlich hoch wie zwischen den Experten und der automatischen Bewertung (Experten: 0,48; Experten versus automatische Bewertung: 0,52).
Diskussion
Die automatische Spracherkennung ist eine objektive Methode, um die Sprachverständlichkeit zu quantifizieren und dient somit als ein globales Maß für die kommunikative Kompetenz. Dies konnte bisher an Patienten mit ausgeprägter Stimmstörung [Ref. 1] sowie nun bei Patienten mit Sprechstörung dargestellt werden. Es besteht eine hohe Übereinstimmung zur Bewertung durch Experten, bzw. die automatische Bewertung differiert nicht mehr zur Expertenbewertung als die Expertenbewertung untereinander. Durch die Verwendung von Einzelwörtern ist keine Verfälschung durch kontextuelle Hilfen bei der Bewertung möglich, wie sie von menschlichen Bewertern vor allem bei schlecht verständlicher Sprache genutzt werden könnte. Die Methode kann daher als geeignet für die quantitative Bewertung der Verständlichkeit angesehen werden.
Bei der kleinen Patientengruppe sind derzeit noch keine verlässlichen Aussagen zur Verständlichkeit in Abhängigkeit von unterschiedlichen Spaltfehlbildungstypen möglich. Dies soll im weiteren an einem größeren Kollektiv untersucht werden. Normwerte für unterschiedliche Altersgruppen müssen zum Vergleich erhoben werden. In Zukunft wird diese Methode die Ermittlung des Einflusses verschiedener Sprechstörungen auf die Verständlichkeit verbessern sowie zur exakten Erfassung der Ergebnisqualität verschiedener therapeutischer Konzepte dienen können.
Danksagung
Diese Arbeit wird von der Johannes-und-Frieda-Marohn-Stiftung des Universitätsklinikums Erlangen gefördert.
Literatur
- 1.
- Schuster M, Haderlein T, Nöth E, Lohscheller J, Eysholdt U, Rosanowski F. Intelligibility of laryngectomees' substitute speech: automatic speech recognition and subjective rating. Eur Arch Otorhinolaryngol. 2006;263(2):188-93.
- 2.
- Fox AV. PLAKSS - Psycholinguistische Analyse kindlicher Sprechstörungen. Frankfurt a.M.: Swets & Zeitlinger; 2002. Now available from Harcourt Test Services GmbH, Frankfurt a.M. http://www.harcourt.de.