Lyra (kodek)

Z Wikipedie, otevřené encyklopedie

Lyra je zvukový kodek vyvinutý společností Google, který je určen ke kompresi řeči. Využívá algoritmus založený na strojovém učení (ML), který pracuje s nižším datovým tokem.[1]

Vlastnosti[editovat | editovat zdroj]

Lyra využívá ke kompresi řeči přístup založený na neuronových sítích, který umožňuje získat vysoce kvalitní zvuk při nízkém datovém toku. Kodek je navržen tak, aby byl vysoce efektivní a umožňoval komunikaci v reálném čase s minimální latencí.

Lyra podporuje tři různé konstantní datové toky: 3,2 kb/s, 6 kb/s a 9,2 kb/s.

Výhodou tohoto kodeku je, že se jedná o projekt s otevřeným zdrojovým kódem, což znamená, že je volně dostupný a kdokoliv jej může upravovat. Kodek je k dispozici pod licencí Apache 2.0, která umožňuje komerční i nekomerční použití.[1]

Kodek Lyra je také navržen tak, aby byl vysoce přenosný, s optimalizovanou implementací pro architektury ARM i x86. Kromě toho lze kodek používat ve spojení s dalšími komunikačními protokoly založenými na WebRTC.[2]

Způsob fungování[editovat | editovat zdroj]

Z řeči se extrahují charakteristické rysy, které jsou následně komprimovány pro přenos. Na druhé straně generativní model používá tyto funkce k rekonstrukci řeči.[3]

Historie[editovat | editovat zdroj]

Poprvé byl kodek Lyra oznámen společností Google v únoru roku 2021 jako experimentální kodek pro kompresi řeči při nízkém datovém toku. Vývoj kodeku vedl tým umělé inteligence společnosti Google s cílem zlepšit kvalitu hlasové komunikace v sítích s nízkou šířkou pásma.[2]

V dubnu 2021 společnost Google zveřejnila první verzi kodeku Lyra jako open-source projekt na serveru GitHub. Počáteční verze obsahovala předem natrénovaný model pro kódování a dekódování řeči při rychlosti 3 kb/s, který byl optimalizován pro použití ve WebRTC, protokolu pro komunikaci v reálném čase.

Roku 2022 byla vydaná Lyra V2 s novou architekturou založenou na kodeku SoundStream. Podporuje více platforem, má nižší latenci a generuje kvalitnější zvuk.[4]

Využití[editovat | editovat zdroj]

Lyra kodek je navržen pro použití v komunikačních aplikacích v reálném čase, jako jsou videokonference (například ve spojení s AV1), online hry a hlasoví asistenti. [2]

Lyra je podporována v systémech Android, Linux, Mac i Windows.[1]

Odkazy[editovat | editovat zdroj]

Reference[editovat | editovat zdroj]

  1. a b c GitHub - google/lyra: A Very Low-Bitrate Codec for Speech Compression. GitHub: Let’s build from here · GitHub [online]. Copyright © 2023 GitHub, Inc. Dostupné z: https://github.com/google/lyra
  2. a b c Lyra: A New Very Low-Bitrate Codec for Speech Compression – Google AI Blog. Google AI Blog [online]. Dostupné z: https://ai.googleblog.com/2021/02/lyra-new-very-low-bitrate-codec-for.html
  3. XDA: Google Duo uses a new codec for better call quality over poor connections [online]. Dostupné z: https://www.xda-developers.com/google-duo-lyra-codec-better-call-quality/
  4. Lyra V2 - a better, faster, and more versatile speech codec | Google Open Source Blog. Google Open Source Blog [online]. Dostupné z: https://opensource.googleblog.com/2022/09/lyra-v2-a-better-faster-and-more-versatile-speech-codec.html