Razvijen sintetizator za srpski i engleski jezik na bazi neuronskih mreža


Citaj mi

 

Postoje dve osnovne grupe metoda za sintezu govora na osnovu teksta – metode zasnovane na direktnom povezivanju govornih segmenata i parametarske metode. Parametarske metode, među kojima su i one koje se zasnivaju na neuralnim mrežama, u poslednje vreme postaju sve popularnije, pre svega zahvaljujući svojoj fleksibilnosti. Naime, one pružaju mogućnost promene karakteristika glasa, odnosno identiteta govornika i stila govora, i kao takve su dovele i do pojave novih, atraktivnih aplikacija. AlfaNumov tim, koristeći vlastite govorno-jezičke resurse, softverske module kao i određene open-source alate namenjene radu s neuralnim mrežama, uspeo je da razvije kvalitetnu parametarsku sintezu govora na srpskom i engleskom jeziku. U visoku razumljivost i izuzetnu prirodnost sinteze moguće je uveriti se na osnovu sledećih primera:

  • Spiker čita tekst:

    1.

    2.

    3.

    4.

    5.

    6.

  • Sintetizovani glas izgovara tekst:

    1.

    2.

    3.

    4.

    5.

    6.

Objavljeno 10.03.2017.