Axon - Voice Assistant


Citaj mi

 

Axon - Voice Assistant je aplikacija koja omogućuje izdavanje glasovnih komandi pametnom telefonu: pozivanje po imenu kontakta ili po broju telefona, slanje poruka (čak i Viber, Skype, WhatsApp), iniciranje navigacije, glasovni unos beleški itd.



Ključne osobine:

  • Pozivanje glasom (ime kontakta ili telefonski broj)
  • Upravljanje adresarom i kontaktima
  • Upravljanje SMS porukama
  • Upravljanje evidencijom poziva
  • Lako baratanje kalendarom i alarmima
  • Izmena sistemskih podešavanja (datum, vreme, mreža...)
  • Pokretanje aplikacija
  • Podržava srpski i hrvatski jezik

Kako radi

Dijalog menadžer

Ovaj modul je odgovoran za čitavo ponašanje sistema. On koristi izlaz prepoznavača govora kao svoj ulaz i preduzima odgovarajuću akciju.

Definiše se skup zadataka, sa jasnim specifikacijama koje su informacije potrebne za njihovo izvršavanje. Neki od primera ovih zadataka su: pozivanje kontakta, slanje SMS poruke, upravljanje kalendarom i logovima, pokretanje aplikacija, menjanje sistemskih podešvanja i slično.

Ukoliko sistem ne uspe da prepozna govornu komandu korisniku se prikazuje odgovarajuća poruka. Ukoliko korisnik ne saopšti sve potrebne informacije, sistem postavlja dodatna pitanja.

Razumevanje prirodnog govora

ovaj modul konvertuje korisničke upite u formu pogodnu za dijalog menadžer. Na primer: ukoliko je korisnički upit prepoznat kao "Želim da pošaljem SMS Vesni Petrović" dijalog menadžer će primiti: "command: SEND_SMS; contact: Vesna Petrović".

Generisanje prirodnog jezika

Funkcija ovog modula je obrnuta funkciji razumevanja prirodnog govora. Konkretno, ovaj modul konvertuje informaciju poslatu u obliku koji je pogodan dijalog menadžeru u rečenice prirodnog govora.

Implementacija govornih tehnologija na mobilnim platformama

Sve do nedavno prepoznavanje govora je bilo ograničeno na male rečnike i PC platformu. Rečnik koji ova aplikacija korisi je znatno veći i softver je optimizovan da se prilagodi ograničenim resursima mobilnih uređaja.

Što se tiče sinteze govora, naša prethodna rešenja su visoko kvalitetna ali ograničena na PC tehnologiju. Sada smo razvili manje zahtevnu verziju kompatibilnu sa operativnim sistemima pametnih telefona. Ovo je moguće uz nešto degradacije u kvalitetu sinteze koja je potpuno prihvatljiva sa stanovišta ciljnih aplikacija.

Tačnost prepoznavanja govora

Poznato je da mnogi prepoznavači renomiranih proizvođača funkcionišu sa nedovoljnom tačnošću, čak i za veće jezike, što dovodi do frustracije i nezadovoljstva korisnika.

U želji da se poveća tačnost prepoznavanja, jezički model koji se koristi u ASR je specijalno prilagođen funkcionalnosti koja se u ovom slučaju traži a u slučaju nepoznatih reči (na primer retka vlastita imena) korisnik uvek može da ih ukuca standardnom tastaturom.