NoviceTehnika

Tehnologija za pomoč ljudem z motnjo govora

Projekt »Own My Voice« učinkovito prepoznava in interpretira govor.

Xiaomi je predstavil svojo najnovejšo aplikacijo naprednih algoritmov in lastne govorne tehnologije. Tehnologija pretvorbe besedila v spontani govor, ki jo je razvil Xiaomi AI Lab, se uporablja za ustvarjanje prilagojenega glasu za uporabnika z motnjami govora.

Uporabnik tako lahko komunicira z drugimi z uporabo »svojega glasu«, namesto tipičnega monotonega elektronskega glasu. Kot del predraziskovalnega projekta »Own My Voice«, ki ga vodi Tehnični odbor Xiaomi, ta poskus dokazuje zavezanost Xiaomija k uporabi tehnologije za dober namen in k doseganju svojega poslanstva »naj vsi na svetu uživajo v boljšem življenju z inovativnimi tehnologijami«.

Kako je Xiaomi izpeljal projekt?
Da bi ustvarili najbolj primeren in personaliziran glas za prejemnika le-tega, je projektna skupina zaposlila več kot 200 prostovoljcev znotraj Xiaomija, ki so »darovali« svoje glasove. Uporabili so algoritem za ujemanje glasovnega odtisa, da bi uskladili značilnosti glasov prostovoljcev s tistimi od prejemnika. S tem pristopom so našli najprimernejši glas kot osnovni zvok glasovne reference. Glede na personalizacijo in zaščito zasebnosti je bil izbrani pravi glas obdelan s kompleksno akustično modifikacijo za oblikovanje novega in izvirnega zvoka glasu. Nato so uporabili tehnologijo pretvorbe besedila v govor v spontanem slogu za usposabljanje modela umetne inteligence, s čimer je ta novi glas postopoma pridobil naravni ritem in intonacijo, ki lahko resnično izrazi čustva in ton človeka.

Projekt »Own My Voice« združuje vrsto najnaprednejših algoritmov s Xiaomijevo lastno razvito govorno tehnologijo, s čimer zagotovi specifičnost, varnost in visoko pristnost sintetiziranega glasu, kar ustvarja novo idejo o prilagojeni sintezi govora za uporabnike z govornimi motnjami.

Tehnologija pretvorbe besedila v govor spontanega sloga v bistvu naredi sintetizirani glas v svoji intonaciji, premoru, hitrosti in drugih značilnostih podoben pravemu. S tem se monoton in nenaraven občutek elektronskega glasu nadomesti z bolj naravnim. Trenutno se ta tehnologija uporablja za številne pametne naprave, opremljene s Xiaoaijem, glasovnim pomočnikom AI podjetja Xiaomi.

Rudi Leskovec
foto: Xiaomi

Povezani članki

Dodaj odgovor

Vaš e-naslov ne bo objavljen.

Preberite še
Close
Back to top button