4 januari 2019
cross media cafe Business Data

Van typen, tappen en swipen naar praten

Maarten FritzGerald - CMC Nieuwe Interfaces

Volgens Maarten FritzGerald praten we over tien jaar meer met apparaten dan met onze eigen partner. Op het Cross Media Café nieuwe interfaces vertelde hij over de staat van voice-diensten in Nederland en daarbuiten. De twee partijen die het voortouw nemen zijn Google en Amazon. Zij hebben op dit moment de meest populaire digitale assistenten, namelijk: Google Assistant en Amazon Alexa. “Sommige mensen denken dat er een soort iPhone-moment aankomt voor voice, want Samsung is bezig met Bixby 2.0” zegt de voice ondernemer.

Ook beweert Maarten dat de adoptie van voice sneller gaat dan die van mobiel. De eerste reacties zijn te vergelijken met de reactie van mensen op een mobiele telefoon in 1998. Veel mensen vonden dit toen ook onzin, maar nu is de smartphone niet meer weg te denken.

KRO-NCRV zet in op voice

Ook Vera Holland, content specialist bij KRO-NCRV, denkt dat we gaan praten in plaats van typen, tapen en swipen. Naast het ontwikkelen van concepten is de afdeling innovatie van KRO-NCRV non-stop bezig met de kansen van nieuwe technieken. “We zagen stemgestuurde interfaces steeds populairder worden in Amerika. We wilden niet afwachten tot dit naar Nederland kwam, we wilden hier nu al op ontwikkelen.” Dus ging de omroep inzetten op voice bij een van hun belangrijkste merken: lifestyle tv-programma BinnensteBuiten.

Met de tekst: “praat met Chef-Kok BinnesteBuiten’’ kan je de kookhulp oproepen in de Google Assistent app. Hoe heeft KRO-NCRV de ontwikkeling van de kookhulp aangepakt? Omdat dit nieuw was voor KRO-NCRV hebben ze het concept op verschillende manieren getest. De belangrijkste learnings waren: gebruik een duidelijke vraagstelling, beperk de informatie per stap en creëer niet te hoge verwachtingen. Ook moet je zorgen voor fall-backs, zodat je iemand weer de juiste richting op kan sturen. “Interessant is dat eigen denkvermogen bij mensen bij afneemt. Houd er dus rekening mee dat mensen bij voice iets uitschakelen en helemaal opgaan in het verhaal. Hierdoor zetten ze niet altijd meer eigen stappen. Met tijdsaanduiding en bevestigingen kan je hierop inspelen” vertelt Vera.

Vera Holland - CMC Nieuwe Interfaces

Er is bewust gekozen voor de stem van Chef-Kok Sharon de Miranda. De stem van Google is naar Vera’s idee toch echt minder persoonlijk en met Sharon heb je toch ook een hele andere sfeer. Het gebruiken van een eigen stem wilt Vera niet iedereen aanbevelen. Want ondanks dat het een enorme meerwaarde is op de beleving zijn er ook nadelen. Zo moet het script direct goed zijn, is intonatie essentieel en heb je ook te maken met hogere kosten.

Drie platforms die mooie dingen doen met stem

Naast de grote wereld van de grote bedrijven zijn er ook kleinere bedrijven die platforms ontwikkelen om iets moois te doen met de stem. Op het Cross Media Café presenteerden Speaky, Zoom Script en Prappers Media.

Prappers Media – Ontwikkelen van voice-apps

Het door Joey Scheufler in 2016 opgerichte Prappers Media richt zich met Voice Search Digital op voice strategieën. De agency maakt en bedenkt voice-apps voor de Google Assistent en de Amazon Alexa. Volgens Joey moet je ervoor zorgen dat je een voice-app maakt waarin je een échte vraag beantwoord met menselijk inzicht. Deze vragen begin meestal met een van de zes W’s: wie, wat, waar, wanneer, waarom of hoe. Joey neemt de Bravo Tango voice-app van National Geographic als voorbeeld. Deze app is ontwikkeld naar aanleiding van een mini-serie over terugkerende soldaten. Deze app draait om de vraag: Hoe voel je je?

“Naast een mooie manier om veteranen te helpen is het interessante is dat deze voice-app eigenlijk is ingezet als een soort marketingtool ter promotie van de serie. Over deze voice-app werd enorm veel geschreven en het heeft daadwerkelijk ook een toegevoegde waarde.”

Speaky – Softwareplatform voor voice technologie

Ook Liam Tjoa denkt dat de toekomst spraakgestuurd is. Deze pas 21-jarige ondernemer heeft samen met Tim van der Wiel al twee bedrijven opgericht. In 2016 richtten zij het succesvolle snapchatmarketing bureau GoSpooky op. Inmiddels werken zij hier met grote internationale merken zoals KLM, HEMA en IKEA. Het duo is ervan overtuigd dat voice de volgende belangrijke challenge is voor grote merken. Daarom hebben zij in 2018 Speaky opgericht, een softwareplatform voor voice technologie.

Zoom Script – Voice omzetten in tekst

Een ander interessant platform is Zoom Script. Dit is een slimme manier om voice om te zetten in tekst, “want typen is wel heel ouderwets’’ aldus Ronja Slierendrecht. Waarom zou je dat willen? In Nederland zijn 1,3 miljoen doof en/of slechthorend. Dit is volgens Ronja een gemiste kans, want content is vaak niet op deze groep afgestemd. Een tweede ding is dat 40% van alle werknemers twee of meer uur per week besteedt aan het uitwerken van gesprekken. Zoom Script is toegankelijk voor het grote publiek. Voor 25 cent per minuut kan je een audiobestand uploaden. “Een op hol geslagen kansberekening analyseert het bestand en berekent welk woord er gebruikt wordt. Hier gebruiken we machine learning voor’’ vertelt Ronja.

Ronja Slierendrecht - CMC Nieuwe Interfaces

“Taal leeft en is dus nooit af”

Om de foutmarge te verlagen ontwikkelt Zoom Script taalmodellen. Een arts gebruikt immers andere woorden dan een advocaat. Verder merkt Zoom Script dat taal leeft, het model is nooit af. Want soms duiken er nieuwe woorden, namen of termen op zoals ‘fipronil’ en ‘Trump’. De groep gebruikers is te onderscheiden in twee groepen. De eerste groep zijn mensen de te veel tijd kwijt zijn aan routine werk, bijvoorbeeld het uitwerken van diepte-interviews. De tweede groep bestaat uit mensen die werken in de (online) media. Video’s die zijn ondertiteld worden tot op drie keer beter bekeken. Daarnaast werkt de koppeling tussen taal en beeld ook goed voor mensen die de taal niet optimaal beheersen. Mogelijk zijn er in de toekomst ook nog kansen op het direct vertalen van de transcriptie naar een andere taal.

Mediabox met spraakbesturing

Dankzij de komst van de nieuwe 4k-mediabox met afstandsbediening die beschikt over spraakbesturing kunnen Ziggo-klanten straks praten tegen hun tv. Er is bewust gekozen voor een knop op een afstandsbediening. Ashley Grossman is verantwoordelijk voor TV personalisation & discovery bij Liberty Global. De afstandsbediening hoort volgens Ashley bij tv-kijken. Verder is het handig dat één persoon het systeem opdrachten geeft. Ook geef je de gebruiker door middel van een knop de macht om het systeem in- en uit te schalen. Met de afstandsbediening kan je straks bijvoorbeeld terug- en voor uitspoelen, zappen of zoeken naar iets waarnaar je wilt kijken. Het is nog onduidelijk wanneer deze nieuwe mediabox in Nederland zal verschijnen.

Ashley Grossmann - CMC Nieuwe Interfaces

Een plekje veroveren

Jeroen de Bakker vertelt dat Talpa Network haar best doet om een plekje te veroveren in de nieuwe routines van mensen. Daarom hebben zij ook ingezet op voice. Als je de Google Assistent vraagt ‘Luister naar 538 Nieuws’ kan je snel worden bijgepraat over het laatste wereldnieuws, de ontwikkelingen in de showbizz en het weer. Het is ook mogelijk om op commando naar je favoriete zender in JUKE te luisteren via Alexa. Je kan bijvoorbeeld ook vragen welk nummer of welke artiest je hoort. Naast de praktische kant, kan je ook verrast worden met muzikale grapjes die alles te maken hebben met het brede aanbod van radio- en bijbehorende themazenders. Vraag bijvoorbeeld aan Alexa:

  • Alexa, ask JUKE to annoy my neighbors
  • Alexa, ask JUKE to play Nick & Simon
  • Alexa, ask JUKE to write me a song

Beeldherkenning

Naast spraakherkenning is beeldherkenning ook in opkomst. Met een klein deel van het gezicht kan het bedrijf 20Face een persoon herkennen. Dit biedt kansen voor veiligheid, maar ook voor gemaksvoorziening. Op deze manier kan je bijvoorbeeld toegang krijgen tot een stadion of herkend worden in de massa. CEO Peter Hoekstra vertelt dat ze bezig zijn met het ontwikkelen van een app waarin je kan aangeven met welke organisaties jij je gezichtsvectoren wilt delen.

Foto’s, slides en interviews

Het Cross Media Café nieuwe interfaces werd op 18 december georganiseerd door Media Perspectives en Beeld en Geluid. De foto’s van het evenement zijn hier te vinden. Ook zijn er verschillende interviews afgenomen met sprekers. Bekijk het interview van Maarten Lens-FritzGerald (voice ondernemer), Ronja Slierendrecht (Zoom Script) en Vera Holland (KRO-NCRV). De slides van de sprekers zijn hier te vinden.