Hlasové vyhledávání

Z Wikipedie, otevřené encyklopedie
Skočit na: Navigace, Hledání

Viz také článek: Internetový vyhledávač

Hlasové vyhledávání (voice search) je vyhledávání informací pomocí hlasové modality: hledaný výraz či klíčová slova se zadávají hlasově, nikoli za pomocí klávesnice nebo jiného vstupního zařízení. Tento způsob vyhledávání a ovládání technického zařízení hlasem je výhodný především pro mobilní zařízení. Mobilní zařízení totiž nedisponují tak kvalitními a dobře ergonomicky řešenými vstupními možnostmi jako stolní počítače nebo notebooky. Další rozdíl je v tom, že mobilní telefony, tablety atd. jsou používány v jiných situacích (ve spěchu, v tramvaji, při chůzi městem apod.), kdy je použití hlasového vstupu více uživatelsky přívětivé. Teto trend je také možné vypozorovat z chování největších hráčů na trhu v oblasti hlasového vyhledávání resp. ovládání mobilního zařízení hlasem, jako je Google, který svou aplikaci pro hlasové vyhledávání Voice search nabízí především pro mobilní zařízení fungující na platformě Android verze 2.1 a vyšší nebo pro Apple iPhone. Dalším možným hráčem v oblasti rozpoznávání řeči a hlasového vyhledávání je společnost Vlingo, specializující se pouze na mobilní zařízení (výše zmíněný Google nabízí alternativu i pro nemobilní zařízení v podobě plug-in(u) do svého prohlížeče Chrome), s aplikací Vlingo Find. Další alternativou je Bing Voice Search[1] od společnosti Microsoft, který je prozatím dostupný pouze na americkém trhu. Aplikací pro hlasové vyhledávání a obecně pro hlasový vstup pro jakékoli účely je celá řada, nicméně v současné době pouze Voice search od googlu nabízí možnost vyhledávání v češtině.

Historie[editovat | editovat zdroj]

Prvními systémy, které používaly hlasové vyhledávání jsou tzv. Directory assistance jedná se o podobnou službu, která je v České republice dostupná na telefonním čísle 1188. Google tímto způsobem s hlasovým vyhledáváním začínal, když v roce 2007 spustil službu GOOG-411[3]. Uživatel na svém telefonu vytočil číslo 800-466-4411 nebo 877-466-4411, pomocí hlasového vstupu zadal parametry vyhledávání a svůj dotaz, aby mu byla posléze zdělena odpověď na hledaný dotaz prostřednictvím syntetizovaného hlasu nebo SMS[4]. Celý proces probíhal automatizovaně bez přičinění operátora. Z této služby se později vyvinula služba Google Voice Search (rok 2008) a poté byla služba GOOG-411 úplně zrušena (rok 2010) [5]. Podobným vývojem prošlo hlasové vyhledávání v podání Microsoftu, který ovšem svou službu BING-411 provozuje souběžně s Bing Voice Search až do dnešních dnů.

Technické řešení[editovat | editovat zdroj]

Po technologické stránce musí mít hlasové vyhledávání velice robustní řešení. To se projeví už když narazíme na počet slov, které musí takové systémy evidovat ve své databázi. Např. české hlasové vyhledávání poskytované googlem má databázi "v rozsahu více než milionu (…) slov"[6]. Takovou databázi je nejdříve nutné vybudovat. To je možné udělat několika způsoby. Jeden z nejvhodnějších je zadat tento úkol přímo uživatelům hlasového vyhledávání. Tento způsob částečně používá Google[9], který všechny záznamy o vyhledávání ukládá, aby tak zlepšil svoje výsledky hledání v závislosti na rozpoznávání řeči. A zároveň takto stále rozšiřuje svou databázi hlasových samplů. Další způsob může být využití databáze jiného systému jako při přechodu z GOOG-411 na Google Voice Search (viz. také BING-411). Nebo celý akustický model vybudují vývojáři sami [2]. Této komponentě systému se říká akustický model. Další komponentou je tzv. pronunciation model, která zajišťuje, aby byly rozpoznány také různé instance téhož slova resp. aby bylo slovo rozpoznáno nezávisle na mluvčím. Třetí komponentou je jazykový model. Ten zajišťuje, aby se ze vstupního dotazu vybral "nejpravděpodobnější výraz"[10]. Celý proces tedy probíhá následovně: uživatel vysloví svůj dotaz, ten se zašle do vzdáleného systému kde se pomocí akustického modelu, pronunciation modelu a jazykového modelu převede vyslovená fráze do nejpravděpodobnějšího textového ekvivalentu. Následně fráze projde běžným search enginem např. od Googlu a uživatel dostane výsledek. Dotaz může uživatel dále zpřesňovat nebo měnit jako při běžném vyhledávání. Celý proces je ilustrován na obr. 1.

Použité zdroje[editovat | editovat zdroj]

[1] Tyinternety.cz [online]. 2009-10-7 [cit. 2011-05-12]. Microsoft Bing Voice Search k dispozici v USA. Dostupné z WWW: <http://www.tyinternety.cz/mobilne/microsoft-bing-voice-search-k-dispozici-v-usa-270>.

[2] Ye-Yi Wang; Dong Yu; Yun-Cheng Ju; Acero, A.; , An introduction to voice search, Signal Processing Magazine, IEEE , vol.25, no.3, pp.28-38, May 2008 doi: 10.1109/MSP.2008.918411. Dostupné z WWW: <http://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=4490199&isnumber=4490183>.

[3]Google goog-411 [online]. 2011 [cit. 2011-05-12]. 1-800-GOOG-411. Dostupné z WWW: <http://www.google.com/goog411/index.html>.

[4]Hlasové vyhledávání Google pro chytré telefony přichází do České republiky [online]. 14. 9. 2010 [cit. 2011-05-12]. Dostupné z WWW: <https://docs.google.com/viewer?a=v&pid=sites&srcid=cHJlc3NhdGdvb2dsZS5jb218Y3p8Z3g6NDUzOGZmNTBjYzQ0MTgzYw&pli=1>.

[5]ŠRAJER , Michal. Svět Androida [online]. 11. 6. 2010 [cit. 2011-05-12]. Hlasové vyhledávání v nových jazycích. Dostupné z WWW: <http://www.svetandroida.cz/hlasove-vyhledavani-v-novych-jazycich-201006>.

[6]ŠTŮSEK , Pavel. Svět Androida [online]. 14. 9. 2010 [cit. 2011-05-12]. Google Voice Search – podpora češtiny. Dostupné z WWW: <http://www.svetandroida.cz/google-voice-search-podpora-cestiny-201009>.

[7]HA, Linne. Official Google Mobile Blog [online]. 2011-03-30 [cit. 2011-05-12]. Word of Mouth: Introducing Voice Search for Indonesian, Malaysian and Latin American Spanish. Dostupné z WWW: <http://googlemobile.blogspot.com/2011/03/word-of-mouth-introducing-voice-search.html>.

[8]VYLEŤAL, Martin. Lupa.cz [online]. 15. 9. 2010 [cit. 2011-05-12]. Google spouští českou verzi hlasového vyhledávání. Dostupné z WWW: <http://www.lupa.cz/clanky/google-spousti-ceskou-verzi-hlasoveho-vyhledavani/>.