Huvud Förnya Googles nya text-till-tal-AI är så bra att vi slår vad om att du inte kan berätta för det från en riktig människa

Googles nya text-till-tal-AI är så bra att vi slår vad om att du inte kan berätta för det från en riktig människa

Ditt Horoskop För Imorgon

Kan du se skillnaden mellan AI-genererat datortal och en riktig, levande människa? Du kanske alltid har trott att du kunde. Du kanske är förtjust i Alexa och Siri men tror att du aldrig skulle förväxla någon av dem med en riktig kvinna.



Sakerna håller på att bli mycket mer intressanta. Googles ingenjörer har jobbat hårt med att skapa ett text-till-tal-system Tacotron 2 . Enligt en papper de publicerade den här månaden skapar systemet först ett spektrogram av texten, en visuell representation av hur talet ska låta. Den bilden sätts genom Googles befintliga WaveNet-algoritm, som använder bilden för att producera extremt naturligt klingande mänskligt tal.

Med hjälp av denna metod rapporterar forskarna, 'Vår modell uppnår en genomsnittlig åsiktspoäng (MOS) på 4,53 jämförbar med en MOS på 4,58 för professionellt inspelat tal.' (En genomsnittlig åsiktspoäng är en telekommunikationsterm som mäter hur verklighetstroget något låter.)

Som Googles ljudprover visar kan Tacotron 2 ur kontext upptäcka skillnaden mellan substantivet 'öken' och verbet 'öken', liksom substantivet 'närvarande' och verbet 'närvarande' och ändra dess uttal därefter. Det kan lägga tonvikten på versaler och använda rätt böjning när man ställer en fråga snarare än att göra ett uttalande.

Och det kan generera text som låter så lik mänskligt tal att det är svårt eller omöjligt att känna till skillnaden. Om du vill se hur svårt det är, gå till Googles sidan för ljudprover och bläddra ner till den sista uppsättningen prover med titeln 'Tacotron 2 eller Human?' Där hittar du Tacotron 2 och en riktig person som vardera säger meningar som: 'Den flickan gjorde en video om Star Wars läppstift.'



SPOILER ALERT: För att testa dig själv, lyssna på proverna och gissa vilket är innan du läser resten av den här kolumnen.

Så vilka exempel är text-till-tal och vilka är en verklig mänsklig röst? Googles ingenjörer säger inte men de har lämnat en mycket stor ledtråd. Var och en av .wav-filproverna har ett filnamn som innehåller antingen termen 'gen' eller 'gt.' Baserat på tidningen är det mycket troligt att 'gen' indikerar tal genererat av Tacotron 2, och 'gt' är verkligt mänskligt tal. ('GT' står sannolikt för 'mark sanning', en maskininlärnings term som i grund och botten betyder 'den verkliga affären.')

Förutsatt att detta är korrekt, här är svaren på testet:

'Den flickan gjorde en video om Star Wars läppstift.'

Prov 1: Verklig människa

Prov 2: Tacotron 2

'Hon tog doktorsexamen i sociologi från Columbia University.'

Prov 1: Tacotron 2

Prov 2: Verklig människa

'George Washington var USA: s första president.'

Prov 1: Tacotron 2

Prov 2: Verklig människa

'Jag är för upptagen för romantik.'

Prov 1: Verklig människa

Prov 2: Tacotron 2

Hur många fick du rätt? Och kunde du verkligen se skillnaden, eller var du bara tvungen att gissa?



Intressanta Artiklar

Redaktionen

none
Richard Branson tar till Twitter för att uttrycka kondoleans efter Virgin Galactic Crash
Efter att ett Virgin Galactic-testflyg exploderade och dödade minst en pilot, vände sig företagets VD Richard Branson till Twitter för att uttrycka sin medkänsla.
none
En 13-årig pojke höll bara ett riktigt anmärkningsvärt tal. Dessa 3 saker som spelade störst roll
Det började med sårbarhet och slutade med triumf (allt på två minuter).
none
3 skäl till att fokusera på en specifik nisch kan hjälpa ditt företag
Ju mer ett företag försöker vara allt för alla, desto mer tappar det fokus på de viktigaste kunderna.
none
Neve Campbells familj expanderar! Hon adopterar en pojke som heter Raynor!
Skådespelerskan Neve Campbell och hennes långvariga romantiska partner JJ Feild har fått ett nytt tillskott till sin familj! De har adopterat en pojke nyligen. Den nya ankomsten i Campbell-hushållet Genom Neve Campbells Instagram-inlägg har man fått veta att hon och hennes pojkvän JJ Feild har adopterat en pojke för 5 månader sedan. Hon delade detta på sina sociala medier med en bild som visar familjen, som nu består av fyra medlemmar som trycker på en
none
25 Go-To-fraser som får människor att gilla dig mer
Undrar du hur man får folk att gilla dig? Här är den enkla lösningen.
none
Violet Chachki Organic
Violet Chachki är en professionell modell och TV-personlighet. Violet Chachki är en dragdrottning. burlesk dansare och inspelningskonstnär. Den 1 juni 2015 vann han sjunde säsongen av RuPauls Drag Race. På samma sätt delade Violet en video av sin Tattoo Tour på sin YouTube-kanal. Du kan också läsa ...
none
Eugene Levy Bio
Känn om Eugene Levy Bio, affär, gift, hustru, nettovärde, etnicitet, lön, ålder, nationalitet, höjd, skådespelare, producent, författare och komiker, Wiki, sociala medier, kön, horoskop. Vem är Eugene Levy? Eugene Levy är en kanadensisk skådespelare, producent, författare och komiker.