Na téma, co všechno podnítí koronavirová pandemie, už proběhlo mnoho debat. Všechny − možná až na některé výjimky − opomíjí rozvoj technologií rozpoznávání hlasu a řeči. V době, kdy zdravotnické autority nabádají vyvarovat se doteků sdílených povrchů, je přitom právě hlasové ovládání řešení, jak zapnout osvětlení, vyhledat požadované informace nebo otevřít někomu dveře. Z technické vychytávky se tak stává potřeba.

Podle odhadů by měl trh technologií rozpoznávání hlasu a řeči do roku 2027 dosáhnout hodnot kolem 30 miliard amerických dolarů, tedy zhruba čtyřnásobku současného objemu. Tyto odhady ale pochází z dob před vypuknutím celosvětové pandemie a bude třeba je přehodnotit.

Používání hlasu coby ovladače má už dnes své příznivce. Jeden příklad za všechny: za tři roky od prvního uvedení chytrého reproduktoru s hlasovým asistentem Alexa prodal Amazon přes 100 milionů hlasem ovládaných zařízení a více než polovina jejich majitelů je používá denně.

Možná i vy už jste někdy "napsali" SMS zprávu pouhým nadiktováním. Ze studie, kterou jsme v PwC dělali loni mimo jiné vyplynulo, že globálně je až 30 procent vyhledávacích dotazů na mobilních telefonech zadáváno hlasem a na konci letošního roku to může být až polovina. V celkovém počtu našich interakcí se zařízeními byl hlas doposud stále až druhý za dotekem a důvodů pro to je hned několik − od obavy o zabezpečení a soukromí po prostou skutečnost, že lidé jsou obecně zvyklí dělat věci určitým způsobem a osvojit si jiný přístup jim nějakou dobu trvá.

Infografika: Slova místo rukou. Koronavirus mění způsoby, jakými ovládáme věci

Strach z nákazy však tohle všechno odsouvá na vedlejší kolej. Vždyť jak by to bylo skvělé, mít chytrý zámek, kterému stačí říct a otevře dveře kurýrovi s nákupem, aby jej mohl složit v předsíni a obě strany se tak vyhnuly setkání tváří v tvář. Mimochodem, 44 procent uživatelů hlasových asistentů už dnes jejich pomocí ovládá další zařízení v domácnosti a právě zámky, alarmy a domovní zvonky mezi ně zhruba v pětině případů patří.

Do kanceláří i továren

Jen loni bylo po celém světě prodáno přes 140 milionů hlasem ovládaných chytrých zařízení do domácnosti a letos to bude podle odhadu PwC kvůli pandemii až o třetinu více. Nejenže nárůst bude rychlejší, než se doposud předpokládalo, ale především se domácnosti stanou technologickými pionýry a hlasové ovládání se začne rozšiřovat i za jejich hranice − do práce a na veřejná místa.

Vždyť jaké by to bylo skvělé, nemuset se v kanceláři dotýkat sdílené kopírky nebo si bez obav udělat kávu podle vlastních preferencí v kávovaru, který před chvílí ovládal chrchlající kolega. Z vlastní praxe napadne každého takových příkladů hned několik. Kanceláří to však nekončí. Hlasové ovládání si konečně najde cestu i do výrobního průmyslu, kde lidé nemohou v případě zvýšeného výskytu virových omezení jednoduše odejít pracovat domů.

Hlasová interakce při nastavování, používání nebo údržbě strojních zařízení učiní práci nejen rychlejší a efektivnější, ale především také bezpečnější. Na světě už jsou první hlasem ovládané operační systémy, kupříkladu Athena od iTSpeeX, který je navržený speciálně pro použití na obráběcích strojích. Pracovník pomocí sluchátek s mikrofonem jednoduše stroji řekne, jaké operace má vykonávat, a má okamžitý přístup k návodům, dokumentacím a podobně.

Úspora času i nákladů

Profitovat ze zavedení hlasových technologií tedy budou i samotné firmy, kterým to přinese spokojenější zákazníky či zaměstnance a úsporu nákladů. Zhruba 80 procent zákazníků, kteří nakupovali on-line pomocí hlasu, bylo s celým procesem spokojeno. Brzy tak bude tímto způsobem realizován více než jen každý desátý nákup z mobilu.

Příkladem budiž finanční sektor. Představte si typické ráno, kdy oblékáte děti, dáváte snídani na stůl a pokoušíte se, nebo i celou rodinu, dostat včas ze dveří. Nebylo by hezké dostat připomínku, že se blíží splatnost nějakého účtu, a jednoduchým hlasovým pokynem platbu provést?

To je přitom pouze jeden dílek sklá­dačky. Pro banku − ale třeba i pro mobilního operátora − může zavedení na hlasu založených technologií a s tím související změna některých modelů a procesů napříč front officem i back officem znamenat výrazné zvýšení efektivity a nepřímo tak vést ke snížení cen pro zákazníky a navýšení hodnoty pro akcionáře. Podle analýzy PwC "Tři miliardy důvodů, proč může hlas transformovat bankovnictví" to bude znamenat zvýšení efektivity napříč celým hodnotovým řetězcem o 15 až 35 procent.

Možná vás v této souvislosti napadlo, že přece nebudete při potvrzování plateb vyvolávat do okolí svoje heslo, aby ho někdo mohl zneužít. Odpovědí je přitom samotná technologie. Lidský hlas je totiž něco jako otisk prstu. Sestává z kombinace různých atributů a tuto kombinaci má hlas každého člověka unikátní a nenapodobí ji ani sebelepší imitátor.

Pro uživatele tak je ve výsledku hlasové ovládání stejně bezpečné jako to pomocí klávesnice, a navíc si nemusí pamatovat složitá hesla. Hlasovou biometrii už dnes využívá například Royal Bank of Canada, nizozemská ING nebo britská HSBC, která jen loni pomocí této technologie zabránila podvodům skoro za 400 milionů liber.

Budoucnost bez řečí

Koronavirová pandemie je bezpochyby impulz, který nás popostrčí ke změně zažitých způsobů, jakými interagujeme se zařízeními a okolím obecně. Nezbytné k tomu samozřejmě je, že technologie rozpoznávání hlasu se již posunuly od dob první verze hlasového asistenta Siri od Applu na takovou úroveň, která to umožní.

Kde tento posun skončí, je těžké s jistotou říci. Když před rokem na veletrhu CES v Las Vegas představila španělská firma Smart IoT Labs virtuálního asistenta jménem Miranda, který si pomocí strojového učení osvojuje denní aktivity svého uživatele, aby pak mohl rozdávat příkazy za něj a člověk nemusel ani mluvit, přišlo to většině lidí už přehnané. Dnes je jeho užití v praxi zase o něco uvěřitelnější.

Související