ehem. Wiss. Assistent
E-Mail Link
Adresse Universität Stuttgart
Pfaffenwaldring 47
70550 Stuttgart
Deutschland
Fachgebiet
Blinde Quellentrennung
In natürlicher Umgebung treten Sprachsignale selten in reiner Form auf, meist sind akustisches Hintergrundrauschen oder Echos überlagert.
Der Mensch überhört Geräusche mit kleinem Lärmpegel, kann in einem Stimmwirrwar sogar gezielt einem Gesprächspartner zuhören (sog. Cocktailparty-Effekt). Zu lange Echos hingegen, wie sie bei der Kommunikation über Freisprecheinrichtungen auftreten können, empfindet er als störend.
Negativ wirken sich akustische Geräusche auch bei der maschinellen Sprachverarbeitung aus: Die derzeit verwendeten Algorithmen zur Sprechererkennung und zur Spracherkennung arbeiten bei störungsfrei aufgezeichneten Sprachsignalen gut, in hallenden, rauschenden Umgebungen nimmt die Erkennungsrate deutlich ab.
Neben den bekannten einkanaligen Verfahren zur akustischen Geräuschunterdrückung gewinnt die Sensorgruppen-Signalverarbeitung zunehmend an Bedeutung. Der Aufnahmebereich der aus mehreren Mikrofonen aufgebauten Sensorgruppe wird hierbei elektronisch auf den gewünschten Sprecher ausgerichtet (Beamforming). Durch Auswertung der von der Sensorgruppe aufgezeichnenten Sprachsignale lässt sich auch die Position des Sprechers im Raum ermitteln.
Im Vergleich zur klassischen Sensorgruppenverarbeitung aus der Antennentechnik treten in der Akustik deutlich abweichende Rahmenbedinungen auf: Das Sprachsignal liegt im Basisband, die Lokalisierung und Aufzeichnung erfolgt im Nahfeld der Sensoren und das Signal entsteht nicht an einer Punktquelle, sondern an Mund, Kehlkopf und Brustkorb.
Die Forschung am Lehrstuhl für Systemtheorie und Signalverarbeitung zielt derzeit auf eine Aufbereitung von Sprachsignalen mittels Mikrofonsensorgruppen unter schwierigen Randbedingungen wie stark verhallte Räume, schlechtes Signal-zu-Rausch-Verhältnis oder Echtzeitanforderungen.
Publikationen
- B. Loesch and B. Yang
Performance Study for Complex Independent Component Analysis
to appear in: Blind Source Separation: Advances in Theory, Algorithms and Applications, Springer Verlag - B. Loesch and B. Yang
Cramér-Rao Bound for Circular and Noncircular Complex Independent Component Analysis
IEEE Transactions on Signal Processing 61(2): 365-379 (2013) [ local copy]
MATLAB code and data - B. Loesch and B. Yang
On the Solution of Circular and Noncircular Complex KLD-ICA in the Presence of Noise
Proc. EUSIPCO 2012, Bucarest, Romania, August 2012 - B. Loesch and B. Yang
© Cramér-Rao Bound for Circular Complex Independent Component Analysis
Proc. LVA/ICA 2012, pp. 42-49, Tel Aviv, Israel, March 2012
Note: This version corrects an error in the middle of page 7 of the paper, where the parameters eta and beta have been swapped.
Original uncorrected version - B. Loesch and B. Yang
© On the Relation between ICA and MMSE based source separation
Proc. IEEE ICASSP 2011, Prague, Czech Republic, May 2011 - B. Loesch and B. Yang
© Comparison of Different Algorithms for Acoustic Source Localization
ITG Fachtagung Sprachkommunikation, Bochum, Oktober 2010 - B. Loesch and B. Yang
© Adaptive Segmentation and Separation of Determined Convolutive Mixtures under Dynamic Conditions
LVA/ICA 2010, St. Malo, Frankreich, September 2010 - B. Loesch and B. Yang
© Blind Source Separation based on Time-Frequency Sparseness in the Presence of Spatial Aliasing
LVA/ICA 2010, St. Malo, Frankreich, September 2010 - B. Loesch and B. Yang
© A Study of ICA based DOA Estimation with Respect to Permutation Ambiguity, Scaling Ambiguity and Sensor Gain Mismatch
IWAENC 2010, Tel Aviv, Israel, August 2010 - B. Loesch, F. Nesta and Bin Yang
© On the Robustness of the Multidimensional State Coherence Transform for Solving the Permutation Problem of Frequency-Domain ICA
Proc. IEEE ICASSP 2010, Dallas, USA, March 2010 - B. Loesch, S. Uhlich and B. Yang
© Multidimensional Localization of Multiple Sound Sources using Frequency Domain ICA and an Extended State Coherence Transform
IEEE Workshop on Statistical Signal Processing 2009, Cardiff, UK, September 2009 - B. Loesch and B. Yang
© Online Blind Source Separation based on Time-Frequency Sparseness
Proc. IEEE ICASSP 2009, Taipeh, Taiwan, April 2009 - B. Loesch and B. Yang
© Source Number Estimation and Clustering for Underdetermined Blind Source Separation
Proc. Int. Workshop on Acoustic Echo and Noise Control 2008, Seattle, USA, September 2008
Weitere Angaben:
BSS-Signals