De menselijke stem kan met behulp van AI al worden gekloond en aangepast en bijvoorbeeld voor een ‘deepfake’ gebruikt worden. We bekijken de risico’s en kansen van spraaksynthese.
Als je de zin “Gisteravond droomde ik ervan om op een rups te rijden” of een soortgelijke kant-en-klare zin voorleest bij de spraaksynthesesoftware Replica, maakt dat een kopie van je stem. Hoe meer voicesamples je opneemt, des te realistischer de resultaten klinken. Een schaal van nul tot vijf geeft aan of de software je stem nog kan verbeteren. Bij nul is er nog ruimte voor verbetering en vijf betekent dat Replica genoeg materiaal heeft om een realistische stemkloon te maken. Om de gekopieerde stem in actie te horen, typ je in een dialoogvenster in en klik je op Play. Je hoort je eigen stem dan zinnen zeggen die je nooit hebt opgenomen.
Deepfake met Obama
Het programma van de Australische producent Replica Studios is niet de eerste software in zijn soort. Spraaksyntheseprogramma’s zoals Lyrebird beloven vergelijkbare resultaten. De software van de Canadese start-up met dezelfde naam zorgde voor opschudding met video’s waarin ze zelfgemaakte zinnen in de mond van bekende politici legden zoals hieronder. Soortgelijke fake video’s zijn ook door anderen gecreëerd met uitspraken als “President Trump is a total and complete dipshit” (zie verder naar beneden) – bij nader inzien kon je merken dat dit een kunstmatig gegenereerde stem was, maar het klonk heel geloofwaardig.
De Australische start-up Lyrebird maakte bedrieglijk echte kopieën van stemmen van bekende politici en gebruikte die voor demonstratiedoeleinden in o.a. een deepfake video met Obama (bron: https://youtu.be/YfU_sWHT8mo).
De bètaversie van het programma, die tot voor kort online beschikbaar was, is niet meer beschikbaar. Ook Adobe had al in 2016 een werkend prototype van zijn VoCo-software. Maar dat programma is nooit verder gekomen dan de bètafase. Een van de redenen daarvoor zouden de negatieve reacties van de media kunnen zijn geweest die volgde op de presentatie van de software. Al waren de mogelijkheden om een deepfake video te creëren op dat moment minder ver gevorderd.