Effektive Technologien zur Verbesserung von akustischen Signalen
Audiosignale stellen einen wichtigen Ausgangspunkt für intelligente Verarbeitungssysteme, wie etwa die automatische Spracherkennung oder intelligente akustische Monitoring-Systeme, dar. Was aber tun, wenn die zugrundeliegenden Tonspuren, die audiologischen Daten, durch komplexe Störgeräusche verunreinigt sind? Forschende der Abteilung »Audiosignalverbesserung« am Fraunhofer-Institut für Digitale Medientechnologie IDMT in Oldenburg beschäftigen sich darum mit der Entwicklung von Software- und Hardware-basierten Möglichkeiten zur Verbesserung von akustischen Signalen. Denn wo Audiosignale erfasst werden, müssen diese vorangehend überhaupt nutzbar gemacht werden.
Akustische Signale können auf unterschiedlichste Art und Weise verunreinigt sein – Störgeräusche, Echos und Nachhall stellen nur einen Teil der für die Verarbeitung mit akustischer Sensorik und folgender intelligenter Analyse hinderlichen Faktoren dar. Mittels des Einsatzes von Software- und Hardwarelösungen können Audiosignale aber erheblich verbessert und somit selbst bei anspruchsvollen Umwelteinflüssen, wie starkem Umgebungslärm, nutzbar gemacht werden. Die am Fraunhofer IDMT Institutsteils für Hör-, Sprach- und Audiotechnologie (HSA) entwickelten Verfahren zur Audiosignalverbesserung können dabei in den diversesten Anwendungsfeldern zum Einsatz kommen. Im Sicherheitsbereich etwa kann eine Störgeräuschreduktion relevante Geräusche von irrelevanten trennen und somit wesentlich für die Vorbereitung eines akustischen Monitorings sein, das zum Beispiel Glasbruch oder den Einsatz von Spraydosen erkennen kann. Aber auch in der intelligenten Spracherkennung und Sprachsteuerung, etwa für Smart Home- oder Konferenzsysteme, stellt die Bereinigung von ungewollten Anteilen der eingehenden Audiosignale einen fundamentalen Teil für die weitere Verarbeitung dar. Sogar hörbeeinträchtigten Personen können die verschiedenartigen Lösungen des Fraunhofer IDMT-HSA zu mehr Partizipation im Alltag verhelfen. So ermöglicht Effektives Voice-Filtering sich in einer großen Gruppe von Menschen akustisch auf eine Person im Gespräch zu konzentrieren. Diese Extraktion von Zielsprecher*innen stellt damit nur einen von vielen Mehrwerten der verbesserten Audiosignale dar.
(rah)