Prepoznavanje govora


Citaj mi

 

Automatsko prepoznavanje govora (eng. Automatic Speech Recognition - ASR) spada u najveće tehničke izazove savremenog doba i već više od pola veka zaokuplja pažnju istraživača širom sveta.

Kao i kod svih govornih tehnologija, i ovde je reč o multidisciplinarnom problemu za čije su rešavanje potrebna znanja iz brojnih oblasti, počev od akustike, fonetike i lingvistike, pa do matematike, telekomunikacija, obrade signala i programiranja. Poseban problem predstavlja činjenica da je reč o problemu u izuzetnoj meri zavisnom od jezika.

Zadatak automatskog prepoznavanja govora je da se na osnovu ulaznih podataka u vidu zvučnog zapisa neke govorne celine (reči ili rečenice) dobije odgovarajući tekstualni zapis. Na taj način se govor praktično konvertuje u tekst, odnosno, "prepoznaje se" šta je određeni govornik izgovorio.

Razlikujemo ASR sisteme koji prepoznaju izolovane reči od sistema koji mogu da prepoznaju i povezano izgovorene reči. ASR sistemi se takođe mogu razvrstavati i po veličini rečnika (broj reči koje mogu prepoznati), po tome da li su prepoznaju samo fiksne, unapred zadate reči ili su fonetski (praktično prepoznaju pojedinačne glasove), kao i po tome da li su zavisni ili nezavisni od govornika.

Primene ASR sistema su mnogobrojne i zavise od njegovih karakteristika. U najširoj primeni su ASR sistemi nezavisni od govornika. Ovakvi sistemi koriste se u okviru govornih automata, čija je namena automatsko pružanje usluga pozivaocima (pristup informacijama, iniciranje i kontrola transakcija i slično) uz svu fleksibilnost koju prepoznavanje govora pruža. Pozivalac, naime, ne mora da se kreće kroz složenu strukturu menija pomoću telefonske tastature, već mu je omogućeno da odmah kaže šta želi, čime se vreme poziva smanjuje, a efikasnost sistema posmatrana kroz broj usluženih pozivalaca povećava.

Pročitajte više o AlfaNum softverskoj komponenti za prepoznavanje govora.

 

Starija osoba na telefonu