Energie (zpracování signálu)

Z Wikipedie, otevřené encyklopedie

Energie signálu v časové oblasti se definuje jako velikost skalárního součinu signálu se sebou samým. Jinými slovy je to integrál nebo suma kvadrátů magnitud (absolutních hodnot) signálu v daném čase. U spojitého signálu můžeme psát

,

kde je energie signálu a zobrazení značí skalární součin.

U diskrétní signálů je energie definována analogicky

Rozpoznávání řeči[editovat | editovat zdroj]

Energie signálu se používá pro krátkodobou analýzu signálu při rozpoznávání mluvčích (jejich identifikace či verifikace) či rozpoznávání slov. Energie je vedle střední hodnoty, rozptylu a výkonu hlavní charakteristikou číslicových signálů. Mezi další patří apriorní charakteristiky posloupnosti slov (např. po písmenu y je velmi pravděpodobné, že dalším písmenem bude souhláska). Každé písmeno – na základě rozboru internetového zpravodajství zpracovaného společností NewtonMedia a Technickou univerzitou v Liberci má svou pravděpodobnost výskytu po předchozím písmenu. Tento jev se využívá u přepisu mluvené řeči do počítače pomocí mikrofonu. Významnou roli zde hraje i výskyt tzv. sykavek – hlásek, pro něž je charakteristické vybočení z pitch frekvence. Ty potom z velké míry ovlivňují i výše uvedený rozptyl. Energii řečového signálu (ve smyslu nespojistého číslicovitého signálu s omezeným počtem vzorků), můžeme považovat za příznak řečového signálu pro použití Bayesovského klasifikátoru pro více příznaků při rozpoznávání mluvčích.

Energie
.
Výkon
.