Měřič hluku – Získejte hlubší znalosti o potlačování hluku

Aug 17, 2023

Zanechat vzkaz

Měřič hluku – Získejte hlubší znalosti o potlačování hluku

 

Po pochopení základních rozdílů mezi potlačením hluku (potlačením okolního hluku reproduktorů, aby vzdálení posluchači jasně slyšeli) a aktivním omezením hluku (kompenzací vlastního okolního hluku posluchače), se zaměřme na to, jak dosáhnout potlačení hluku.


Jednou z metod je použití více mikrofonů k potlačení dat. Shromažďování dat z více míst povede k tomu, že zařízení přijímají podobné (ale přesto odlišné) signály. Hlasový signál přijímaný mikrofonem v blízkosti mluvící populace je výrazně silnější než signál sekundárního mikrofonu. Dva mikrofony budou přijímat nehlasový zvuk na pozadí s podobnou silou signálu. Odečtěte informace o zvuku shromážděné mikrofonem se silným hlasem a sekundárním mikrofonem a zbývající většinu tvoří hlasové informace. Čím větší je vzdálenost mezi mikrofony, tím větší je rozdíl signálu mezi bližšími a vzdálenějšími mikrofony, což usnadňuje použití tohoto jednoduchého algoritmu k potlačení šumu. Když však nemluvíte nebo když očekáváte, že se hlasová data v průběhu času změní (například když chodíte nebo běžíte a váš telefon se neustále třese), účinnost této metody se sníží. Potlačení šumu více mikrofonů je jistě spolehlivé, ale další hardware a zpracování má své nevýhody.


Takže, co kdyby tam byl jen jeden mikrofon? Pokud se pro ověření/porovnání nepoužijí další zdroje zvuku, bude řešení s jedním mikrofonem spoléhat na pochopení charakteristik přijímaného šumu a jejich odfiltrování. To souvisí s dříve zmíněnými definicemi ustáleného a nestacionárního hluku. Šum v ustáleném stavu lze účinně odfiltrovat pomocí algoritmů DSP, zatímco nestacionární šum představuje výzvu, hluboké neuronové sítě (DNN) mohou pomoci tento problém vyřešit.


Tato metoda vyžaduje datovou sadu pro trénování sítě. Tato datová sada se skládá z různého (ustáleného a nestacionárního) šumu a čisté řeči, což vytváří syntetizovaný vzor šumu řeči. Vložte datovou sadu jako vstup do DNN a odešlete ji čistým hlasem. Tím se vytvoří model neuronové sítě, který eliminuje šum a bude mít pouze čistou řeč.


I s vyškolenými DNN stále existují určité problémy a ukazatele, které je třeba zvážit. Pokud chcete běžet v reálném čase s nízkou latencí, potřebujete silný výpočetní výkon nebo menší DNN. Čím více parametrů v DNN, tím pomalejší je jeho rychlost. Vzorkovací frekvence zvuku má podobný vliv na potlačení zvuku. Vyšší vzorkovací frekvence znamená, že DNN musí zpracovat více parametrů, ale zase dosáhne vyšší kvality výstupu. Úzkopásmová hlasová komunikace je ideální volbou pro potlačení hluku v reálném čase.


Tento typ zpracování představuje všechny náročné úkoly a cloud computing je velmi zručný při plnění takových úkolů, ale tato metoda výrazně zvyšuje latenci. Vzhledem k tomu, že lidé mohou spolehlivě rozlišit zpoždění přibližně 108 milisekund nebo více, další zpoždění způsobené zpracováním cloud computingu zjevně není ideálním výsledkem. Provozování DNN na hraně však vyžaduje několik chytrých úprav. CEVA je vždy odhodlána zlepšovat naše schopnosti zpracování hlasu a řeči. To zahrnuje ověřené algoritmy srozumitelnosti řeči a rozpoznávání příkazů – tyto algoritmy poskytují jasnou komunikaci a hlasové ovládání i na okrajích. Vítejte, kontaktujte nás a poslouchejte osobně.

 

handheld sound level meter

 

 

 

Odeslat dotaz