Kunstmatige intelligentie (AI) ontwikkelt zich snel. Hoewel niet altijd zichtbaar, zijn AI en machine learning inmiddels doorgedrongen tot vrijwel alle facetten van media- en contentproductie. Ze worden gebruikt voor herkenning van spraak, beeld en patronen, aanbevelingssystemen en vertaalmachines. AI biedt allerlei voordelen op het gebied van gemak, gebruikerservaring en efficiëntie. De technologie is beschikbaar, maar hoe kan je die inzetten in de media? We zetten hier weer 5 toepassingen op een rijtje.
Kunstmatige intelligentie wordt op tal van nieuwe, creatieve manieren toegepast in de media. De stem is zo’n nieuw gebied waarin AI steeds meer wordt gebruikt. Niet alleen kan AI worden ingezet voor stemherkenning, maar het wordt ook ontwikkeld om stemmen te veranderen en nieuwe stemmen te genereren. Altered uit Londen heeft zich hierin gespecialiseerd.
De software van Altered is onlangs gebruikt voor de game The Ascent. Stemacteur Sam Hughes sprak voor deze game 800 regels tekst in. Altered gebruikte die om het stemgeluid van 40 verschillende personages te maken. Volgens de makers is The Ascent de eerste game die de technologie van Altered gebruikt. Die is met name interessant voor kleinere game-ontwikkelaars, die niet de middelen hebben om voor ieder personage een aparte stemacteur in te huren.
Ai wordt ook gebruikt om stemmen na te maken. In een nieuwe documentaire-serie op Netflix, The Andy Warhol Diaries, is kunstmatige intelligentie gebruikt om de stem van de in 1987 overleden kunstenaar te reproduceren. Daarvoor is gebruik gemaakt van het Canadese bedrijf Resemble.ai. In de documentaire is de nagemaakte stem van Andy Warhol te horen die fragmenten voorleest uit zijn memoires.
Deepfakes hebben een nogal negatief imago en dat is misschien ook terecht. Maar dat de onderliggende AI niet alleen kan worden gebruikt om mensen te misleiden, bewijst de Britse startup Flawless. Hun toepassing TrueSync is in staat om films en series heel makkelijk uit te brengen in andere talen. Robert de Niro die Duits spreekt alsof het zijn moedertaal is? Geen probleem voor True Sync.
“Het leven is als een doos bonbons” zegt de moeder van Forrest Gump in de gelijknamige film. “Je weet nooit wat je krijgt.” Behalve bij slecht nagesynchroniseerde films in een andere taal. TrueSync lost dat probleem op. Flawless gebruikt deepfake-technologie om de lippen van acteurs in films aan te passen. Zo kan je stemmen opnieuw inspreken in een andere taal, en de lippen natuurlijk op de nieuwe audio laten aansluiten. Onderstaande demo van TrueSync is indrukwekkend.
Flawless Demo – www.flawlessai.com from Flawless AI on Vimeo.
Het proces begint met het opnemen van een acteur die de dialoog uitspreekt in de gewenste taal, zoals dat ook gebeurt bij nasynchronisatie. De nieuwe audio en het nieuwe beeld worden vervolgens aangeleverd bij Flawless, dat zijn AI-systeem gebruikt om een lipsynchroon beeld te creëren. Dit is een grotendeels geautomatiseerd proces van het aanpassen van mondbewegingen. Toch komt er ook nog een mensenhand aan te pas. Digital effect-kunstenaars verfijnen de resultaten waar nodig voordat Flawless de definitieve versie aan de klant levert.
OpenAI blijft flink aan de weg timmeren met interessante toepassingen van AI. Het heeft nu software ontwikkeld dat tekstinstructies kan omzetten in beelden van hoge kwaliteit. Het programma heet DALL-E en is vernoemd naar de Pixar-robot WALL-E en kunstenaar Salvador Dalí. DALL-E is een neuraal netwerk, een computersysteem dat losjes is gemodelleerd naar de verbonden neuronen in het menselijk brein.
De tekstbeschrijvingen om beeld te generen, kunnen vrij complex zijn. Ze kunnen acties bevatten, kunststijlen en meerdere onderwerpen. Enkele voorbeelden op de blog van OpenAI zijn “een astronaut die in de ruimte in een tropisch resort ligt te loungen” en “teddyberen die onder water met jaren ’90-technologie aan nieuw AI-onderzoek werken”.
OpenAI is oorspronkelijk opgericht als non-profit-organisatie door technologiebazen als Elon Musk. Het bedrijf wil AI ontwikkelen voor positieve menselijke impact en wil de potentiële gevaren beteugelen. Daarom is besloten om DALL-E niet aan het publiek beschikbaar te stellen. OpenAI vindt dat de toepassing gevaarlijk kan zijn als deze zou worden gebruikt om desinformatie te verspreiden.
“Kunstmatige intelligentie breidt zich uit naar nieuwe sectoren, vooral dankzij recente ontwikkelingen op het gebied van deep learning. Het potentieel van AI wordt benadrukt in een rapport van analisten van de Citi-bank. Die stellen dat het gebruik van AI in de media zou kunnen leiden tot een omzet van 75 miljard dollar per jaar.”
Deze intro is niet door een mens geschreven. De tekst is gegenereerd door software van de copywriting-service Copy.ai. Daarvoor heb ik alleen de kop van dit artikel ingevoerd en een paar steekwoorden. Het genereren van marketingtekst is een van de eerste grootschalige toepassingen voor tekstgeneratietechnologie. Die maakte in 2020 een enorme sprong voorwaarts maakte toen het bedrijf OpenAI de commerciële versie van het taalmodel GPT-3 lanceerde. Er zijn nu al tientallen bedrijven die marketingtools aanbieden die content kunnen genereren zoals blogberichten, artikelen en persberichten met behulp van OpenAI’s technologie. Copy.ai is er daar één van.
Copy.ai is een startup die in 2020 is opgericht. Het heeft inmiddels zo’n 20 mensen in dienst. De tekstgeneratie van Copy.ai werkt inmiddels in 25 talen, waaronder het Nederlands. En ik moet zeggen, het werkt best goed. Emerce gebruikte Copy.ai zelfs voor het schrijven van een gedicht. Uit een test in het Engels blijkt ook dat de service de vergelijking met een mens aardig kan doorstaan.
De Hedonometer is een applicatie die op basis van woorden en zinnen op social media onze stemming peilt. De software is bedacht door Chris Danforth en Peter Dodds van de University of Vermont. Danforth onderzoekt al jaren wat social media – met miljoenen berichten in tientallen talen en landen – ons kunnen vertellen over menselijke emotie. De Hedonometer meet de stemming voornamelijk aan de hand van Twitter. Elke dag analyseert de software ongeveer 50 miljoen tweets.
Toen ze de hedonometer voor het eerst creëerden, interviewden Danforth en zijn team sprekers van talen als Engels, Spaans, Indonesisch en Arabisch. Ze vroegen hen om duizenden woorden te beoordelen op een schaal van gelukkig tot verdrietig. Het resultaat is dat woorden en zinnen (en emoji’s) in elke tweet kunnen worden gebruikt om er een waarde aan toe te kennen op basis van de stemming die ze uitdrukken. Zo berekent de Hedonometer het gemiddelde ervan tot een enkele maatstaf voor geluk voor die dag.
Danforth ziet de Hedonometer als een betrouwbare thermometer van de stemming in de wereld. Die stemming is de afgelopen jaren wel aan grote schommelingen onderhevig, zegt hij. “In de afgelopen vijf jaar hebben we de gebruikelijke wekelijkse cyclus kapot zien gaan. Elke dag vinden er wel gebeurtenissen plaats die de stemming beïnvloeden. Er is nu veel meer wat ik emotionele turbulentie zou noemen.”
Lees hieronder ook vorige edities van de Top 5 nieuwe toepassingen van AI: