Axon - Voice Assistant


Citaj mi

Axon - Voice Assistant (AVA) je aplikacija koja omogućuje izdavanje glasovnih komandi pametnom telefonu: pozivanje po imenu kontakta ili po broju telefona, slanje poruka (čak i Viber, WhatsApp), iniciranje navigacije itd.



Ključne osobine:

  • Pozivanje glasom (ime kontakta ili telefonski broj)
  • Upravljanje adresarom i kontaktima
  • Upravljanje SMS porukama (ne i diktiranje - ono je moguće preko Guglovog servisa)
  • Pozivanje i slanje poruka preko Viber i WhatsApp aplikacija
  • Mogućnost da se sve akcije sprovedu i dodirom, bez upotrebe glasa, na način na koji su korisnici navikli
  • Brz ulazak u aplikaciju i zadavanje komande nakon drmanja telefona ("shake")
  • Rad bez Internet konekcije (osim inicijalno, pri prvom pokretanju)
  • Mogućnost korišćenja padeža na prirodan način ("Pozovi Vesnu" umesto "Pozovi Vesna")
  • Inteligentno tretiranje imena napisanih bez naših slova (može se reći "Lučić" iako je u imeniku "Lucic")
  • Upravljanje evidencijom poziva
  • Filtriranje kontakata, poruka i liste poziva po delu imena, odnosno liste poziva prema tome da li korisnik želi samo odlazne/dolazne/propuštene pozive
  • Efikasna navigacija do bilo koje glasom odabrane lokacije, preko Google Maps ili Here maps.

Kako radi

Dijalog menadžer

Ovaj modul je odgovoran za čitavo ponašanje sistema. On koristi izlaz prepoznavača govora kao svoj ulaz i preduzima odgovarajuću akciju.

Definiše se skup zadataka, sa jasnim specifikacijama koje su informacije potrebne za njihovo izvršavanje. Neki od primera ovih zadataka su: pozivanje kontakta, slanje SMS poruke i slično.

Ukoliko sistem ne uspe da prepozna govornu komandu korisniku se prikazuje odgovarajuća poruka. Ukoliko korisnik ne saopšti sve potrebne informacije, sistem postavlja dodatna pitanja.

Razumevanje prirodnog govora

Ovaj modul konvertuje korisničke upite u formu pogodnu za dijalog menadžer. Na primer: ukoliko je korisnički upit prepoznat kao "Pošalji poruku Vesni Petrović" dijalog menadžer će primiti: "command: SEND_SMS; contact: Vesna Petrović".

Generisanje prirodnog jezika

Funkcija ovog modula je obrnuta funkciji razumevanja prirodnog govora. Konkretno, ovaj modul konvertuje informaciju poslatu u obliku koji je pogodan dijalog menadžeru u rečenice prirodnog govora.

Implementacija govornih tehnologija na mobilnim platformama

Sve do nedavno prepoznavanje govora je bilo ograničeno na male rečnike i PC platformu. Rečnik koji ova aplikacija koristi je znatno veći i softver je optimizovan da se prilagodi ograničenim resursima mobilnih uređaja.

Što se tiče sinteze govora, naša prethodna rešenja su visoko kvalitetna ali ograničena na PC tehnologiju. Sada smo razvili manje zahtevnu verziju kompatibilnu sa operativnim sistemima pametnih telefona. Ovo je moguće uz nešto degradacije u kvalitetu sinteze koja je potpuno prihvatljiva sa stanovišta ciljnih aplikacija.

Tačnost prepoznavanja govora

Poznato je da mnogi prepoznavači renomiranih proizvođača funkcionišu sa nedovoljnom tačnošću, čak i za veće jezike, što dovodi do frustracije i nezadovoljstva korisnika.

U želji da se poveća tačnost prepoznavanja, rečnik koji se koristi za prepoznavanje je specijalno prilagođen trenutnoj aktivnosti. Na primer, korisnik ne može otvoriti određeni kontakt i sa tog mesta tražiti da se pozove neka druga osoba. Ovaj restriktivniji pristup podrazumeva određeni (mada vrlo kratak) period prilagođavanja, ali zato obezbeđuje znatno pouzdaniji rad.