
Deep Learning und Anwendung in der Audiotechnik für Noise Reduction
Noise Reduction oder Rauschunterdrückung ist ein wichtiger Prozess in der Audiotechnik, insbesondere in der Aufnahme, Verarbeitung und Wiedergabe von Audioinhalten. Es gibt verschiedene Methoden zur Rauschunterdrückung, darunter analoge und digitale Filter, adaptive Filter, Wellenform-Subtraktion und statistische Modelle. In den letzten Jahren hat sich jedoch Deep Learning als eine besonders effektive Methode zur Rauschunterdrückung herausgestellt.
Was ist Deep Learning?
Deep Learning ist ein Bereich des maschinellen Lernens, der auf künstlichen neuronalen Netzen basiert. Diese Netze bestehen aus Schichten von Neuronen, die miteinander verbunden sind und Daten durch das Netzwerk leiten. Die Verbindungen zwischen den Neuronen werden durch Gewichte definiert, die während des Lernprozesses angepasst werden, um die Leistung des Netzwerks zu verbessern. Deep Learning basiert auf einem Algorithmus namens Backpropagation, der es dem Netzwerk ermöglicht, Fehler zurück durch das Netzwerk zu propagieren und die Gewichte entsprechend anzupassen.
Deep Learning in der Audiotechnik
Deep Learning wird in der Audiotechnik für verschiedene Aufgaben eingesetzt, darunter Spracherkennung, Klassifizierung von Audioinhalten und eben auch für die Rauschunterdrückung. Das Ziel der Rauschunterdrückung ist es, das Signal von Rauschen zu befreien, ohne dabei das eigentliche Audio zu beeinträchtigen. In der Vergangenheit wurden für die Rauschunterdrückung hauptsächlich statistische Modelle und adaptive Filter eingesetzt. Diese Methoden haben jedoch ihre Grenzen, insbesondere wenn das Rauschen komplexer wird oder wenn das Signal schwach ist.
Deep-Learning-Methoden zur Rauschunterdrückung
Deep-Learning-Methoden zur Rauschunterdrückung sind in der Regel auf der Grundlage von Autoencoder-Netzwerken aufgebaut. Ein Autoencoder-Netzwerk besteht aus zwei Teilen:
einem Encoder-Netzwerk, das das Eingangssignal kodiert, und einem Decoder-Netzwerk, das das Signal wieder in den ursprünglichen Raum dekodiert. Der Encoder-Teil des Netzwerks lernt eine kompakte Darstellung des Signals, während der Decoder-Teil des Netzwerks lernt, wie man das Signal aus dieser Darstellung rekonstruiert. In der Rauschunterdrückung wird das Netzwerk trainiert, um das Signal aus dem rauschigen Signal zu rekonstruieren.
Das Training des Netzwerks erfolgt normalerweise mit einem Datensatz, der aus rauschigen Signalen und sauberen Signalen besteht. Die Netzwerkarchitektur wird so angepasst, dass sie das Signal so genau wie möglich aus dem rauschigen Signal rekonstruiert. Das trainierte Netzwerk kann dann auf neue rauschige Signale angewendet werden, um das Rauschen zu entfernen.
Deep-Learning-Methoden haben sich als sehr effektiv erwiesen, um Rauschen aus Audioinhalten zu entfernen. Ein Beispiel für eine erfolgreiche Anwendung ist die Entfernung von Hintergrundgeräuschen in Video- oder Audioaufnahmen.
Anwendungsbeispiele für Deep Learning Noise Reduction
Es gibt mittlerweile viele Anwendungen für die Deep Learning Noise Reduction.
In der Medientechnik treffen wir sie klassischerweise im Bereich UC an.
UC Softclients, wie z.B. Microsoft Teams, verwenden rudimentäres Deep Learning um dynamische Signale aus dem Raum zu entfernen. Diese Noise Reduction stößt aber sehr schnell an Ihre Grenzen und ist in Zusammenarbeit mit z.B. installierter Audiotechnik meist kontraproduktiv.
Ein Beispiel für Deep Learning Noise Reduction in UC Hardware ist die Biamp Parlé VBC 2500.
Als eines der ersten Hardwaregeräte verwendet die VBC2500 Deep Learning um die Noise Reduction nicht nur auf statische Signale zu trainieren, sondern auch dynamischen „Lärm“ aus dem Sendesignal zu entfernen. Hierzu verwendet Biamp eine aufwändige Mikrofontechnik mit Beamtracking, welche bereits aus den Parlé Mikrofonen bekannt ist. In Verbindung mit Deep Learning ist dies ein ganz neuer Ansatz das Audio für Konferenzen noch sauberer zu machen und dem User das Arbeiten noch mehr zu erleichtern.
Hier finden Sie ein Hörbeispiel für die Deep Learning Noise Reduction der Parlé VBC 2500.

Sollten Sie weitere Fragen zu diesen Produkten haben, zögern Sie nicht sich an uns zu wenden. Unser technisches Supportteam hilft Ihnen gerne weiter.
Hier finden Sie weitreichende Informationen direkt von Biamp.
