| | |
Summary: to appear in: Deutsche Gesellschaft f˜ ur Akustik e. V. (DEGA), Fortschritte der Akustik --- DAGA 2000, Oldenburg, 2000 (in press)
Blinde Quellentrennung als Vorverarbeitung zur robusten Spracherkennung
J˜ orn Anem˜ uller, Michael Kleinschmidt und Birger Kollmeier
AG Medizinische Physik, Carl von Ossietzky Universit˜ at Oldenburg, D--26111 Oldenburg
ane@medi.physik.uni--oldenburg.de http://medi.uni--oldenburg.de/members/ane
I. Einleitung
In diesem Beitrag evaluieren wir den Nutzen blinder Quellen
trennung als Vorverarbeitungsstufe zum Zwecke robuster auto
matischer Spracherkennung. Blinde Quellentrennung (QT) ist
eine Signalverarbeitungstechnik, die es erm˜ oglicht, aus mehre
ren Aufnahmen akustischer ˜
Uberlagerungen (etwa Sprache im
St˜ orger˜ ausch) die zugrunde liegenden Quellsignale (Sprache ge
trennt vom St˜ orger˜ ausch) zu rekonstruieren. Ein spezieller Al
gorithmus f˜ ur QT in verhallter Umgebung ist bereits vorge
stellt worden [ane99]. Eine potentielle Anwendung solcher Al
gorithmen besteht in der St˜ orger˜ auschbefreiung f˜ ur die robuste
automatische Spracherkennung. Das Perzeptionmodell (PEMO)
nach Dau et al. [dau96] wurde bereits zur Merkmalsextraktion
in der automatischen Spracherkennung verwendet. Insbesonde
|