23 april 2015
cross media cafe Business Data

Cross Media Café: Zeven cases over big data in de media

Hoe zetten mediabedrijven big data in? Waar zijn ze mee bezig en waar lopen ze tegen aan? Na de pauze zeven innovatieve cases uit de mediawereld: Yocter, Marktplaats, Cleverlions, RTL, NPO Spirit, Beeld en Geluid en het Doorbraakproject Big Data.

Yocter: Voorspellen met data

Godfried van Loo is creative director bij Yocter en oprichter van semantic search engine Scoutle, social media data analyse tool Statilizer en data aggragator Analysion. Van Loo vertelt wat nodig is om gedrag te kunnen voorspellen met data. Hij ondersteunt bedrijven onder meer bij het vergroten van impact van content op internet. “Content heeft een beperkte houdbaarheid. Het is belangrijk om op het juiste moment te posten”, stelt Van Loo. “Stel, Ajax wil een nieuw shirt verkopen aan de jeugd. Hoe laat moet Ajax hierover dan een berichtje op Facebook plaatsen?” Als eerste is het volgens Van Loo nodig om patronen te ontdekken in gedrag. Bijvoorbeeld: wanneer zit de jeugd op Facebook? En wanneer koopt de jeugd het meest? Als papa thuis is?

Ten tweede moeten gevonden verbanden goed onder de loep worden genomen. Stel de prijs wordt getest. Eerst de hoge prijs en daarna de lage. Het blijk dat een product bij hoge prijs niet verkoopt, bij de lage prijs wel. Dan bestaat de neiging om hier al snel een patroon in te zien: een lage prijs verkoopt beter dan een hoge prijs. “Het is echter belangrijk te achterhalen of er andere factoren meespeelden, bijvoorbeeld problemen met de payments serviceprovider op de dag dat de hoge prijs getest werd.”

Dan is het een kwestie van patronen en verbanden combineren waarmee met redelijk grote zekerheid koopgedrag kan worden verspeld. Voor New Skool Media kan Yocter bijvoorbeeld op basis van het bezoek aan de newssite voorspellen hoeveel mensen proefabonnementen gaan afnemen of juist opzeggen.

Van Loo verkocht semantic search engine Scoutle onlangs aan het Amerikaanse Triberr. “Scoutle helpt bloggers om content waardevoller te maken. De tool kan adviezen geven over de waarde van content op basis van een groot aantal gemeten variabelen en geeft advies over inhoud en optimale tijd van posten.

Godfried van Loo (Yoctor) @ CMC Media & Data from iMMovator

Marktplaats voorspelt: Triangl bikini’s worden hit deze zomer

Robin Schuil, Innovatie programma manager bij Marktplaats.nl (onderdeel van Ebay) vertelt over de trends die kunnen worden afgeleid uit Marktplaats-data. Bij Markplaats.nl gaat een ongelofelijke hoeveelheid data om. De cijfers per dag: 1,3 miljoen bezoekers, 350.000 advertenties, 8 miljoen mensen online en 6 miljoen unieke zoekopdrachten. Markplaats bestaat nu 15 jaar en kan ondertussen op de week nauwkeurig voorspellen welke producten in elke periode favoriet zijn. Schuil noemt seizoenen: in de winter scoren zoekwoorden als skibroek, skipak en snowboard goed. Vlak daarna ‘carnaval’, dan volgen de ‘tuinmeubelen’, gevolgd door ‘barbecue’ en het kampeerseizoen, met vlak daarna- verrassend – de zoektocht naar de ‘winterjas’. Het jaar sluit af met ‘sinterklaas’ en ‘kerst’. Favoriete zoekwoord: gratis. Met op de tweede plaats: iPhone. Markplaats ontdekte ook verbanden tussen temperatuur en zoekwoorden. Bij warmte: ‘airco’ en ‘vliegengordijn’. Bij kou: ‘kachel’.

Aan hand van de zoekopdrachten die op dit moment trending zijn, kan Schuil nu al de trends voor de zomer voorspellen. De Triangl bikini wordt een hit deze zomer en ook de Heelys (sportschoenen met wieltjes in de hak) zijn bezig met een comeback.

Trendvoorspellingen gebruikt Marktplaats alleen voor de eigen online strategie: optimalisatie (homepage), aanbiedingen, nieuwsbrief en hun eigen addwords campagne. Markplaats verkoopt ook geen data. “We hebben in het verleden veel moeite gehad met de data-analyse vanwege de grote hoeveelheid data en hebben het algoritme zelf gebouwd.” Moedermaatschappij eBay gaat het algoritme nu zelf ook gebruiken.

CleverLions: een effectieve contentstrategie met big data

Rutger Verhoeven is mede-eigenaar van CleverLions en hoofd Digitaal BNNVara a.i. Bij BNNVara onderzocht Verhoeven met z’n team wat het beste moment is om content over de BNNVara-merken te pushen via alle kanalen. Ze ontwikkelden daarvoor enige jaren geleden de ‘bubblegraph’, een tool waamee inzichtelijk wordt wanneer mensen online zijn om content te zoeken en wanneer redacties zelf actief waren. Deze tijdstippen bleken vaak niet matchen. Vervolgens is het team in kaart gaan brengen hoe lang content relevant blijft. Dat bleek voor video anders dan voor tekst of fotografie en het was ook per kanaal verschillend. Per kanaal werd ook de relevantie in kaart gebracht wat betreft: sales, conversie en bereik. Hoe relevant is dit kanaal voor bepaalde content? Op basis van deze gegevens en de ‘bubblegraph’ is BNNVara alle merken actief op content gaan sturen. Resultaat: bereik groeit, websites relevanter en er wordt meer over content gesproken. Verhoeven: “Maar weinig webredacties denken na over wat ze met een boodschap willen realiseren: wat is de kpi van mijn twitterpost. Laat staan dat ze achteraf checken of de kpi behaald is om er zo iets van te leren voor de hele contentstrategie. Deze contentaanpak leverde bij het merk GIEL veel resultaat op. Het bleek dat GIEL’s avonds een opvallende bezoekerspiek op zijn app had. Op basis van deze gegevens biedt de GIEL-app alleen voor app-bezitters een unieke avondshow binnen de app. “Het werkt als een malle: traffic is enorm toegenomen en er wordt meer over de show gepraat.”

Deze kennis biedt hij nu – samen met businesspartner Erik van Heeswijk (ex-hoofdredacteur VPRO Digital) – aan in CleverLions om daarmee ook andere mediapartijen te ondersteunen bij hun contentstrategie. Ze ontwikkelden hiervoor een extra instrument waarmee verkeer per kanaal realtime in beeld wordt gebracht  “Als je een verhaal publiceert, wil je weten of het verhaal gevonden wordt en hoe het beter kan.”Wat draagt een tweet bijvoorbeeld bij aan de impact van een boodschap. “CleverLions kan het effect realtime meten en op een timeline aangeven hoe vaak posts gelezen zijn en via welk kanaal: rechtstreeks, facebook, twitter of search engines.” We kunnen ook een realtime analyse geven. Op basis van onze ervaring en de gemeten gegevens geven we advies voor verbetering. Het blijft altijd een kwestie van ervaring opdoen en daar lering uit trekken.”

Rutger Verhoeven (Cleverlions) @ CMC Media & Data from iMMovator

NPO spirit zoekt handlezers

On Demand themakanaal NPO Spirit wil een pluriforme balans vinden van aanbod voor de zeven hoofdstromen. Maar hoe vind je binnen die stromingen de relevante sleutelfiguren en het juiste platform om de content te publiceren? Heinze Havinga, onderzoeker Crossmedialab van de Hogeschool Utrecht ontwikkelde een tool waarmee de redacteur zelf op een eenvoudige manier relevante trefwoorden kan vinden die verband houden met het onderwerp. “Als je ‘Paus’ in tikt, analyseert het prototype alle onderregels van de zoekresultaten in Google. Deze resultaten vergelijken we weer met teletekst-woorden om de woorden te vinden die in spreektaal het meest gebruikt worden.” Stap twee was deze trefwoorden gebruiken om een relevante twittersearch te doen: wie gebruikt deze woorden in zijn tweets. “Dat geeft inzicht in relevante accounts en in platformen.” Vervolgens kan de tool ook nog een analyse van mogelijk relevante tweedegraads accounts maken. Werkt het ook? NPO Spirit is actief aan de slag gegaan met verhalen uitzetten via twitter. “Dit had onmiddellijk effect op het aantal bezoekers.”

Havinga is ook betrokken bij het maken van een verjaardagskalender van Nederland. Hij gebruikte hiervoor onder meer data uit Schoolbank en Hyves, platforms die niet of nauwelijks meer worden gebruikt. Havinga constateerde dat gegevens min of meer op straat liggen. Hij heeft zeer privé gevoelige info van 80.000 mensen. Hij wenst dat de platforms uit de lucht worden gehaald voordat er misbruik van dit ‘data-afval’ wordt gemaakt.

Heinze Havinga (HU) @ CMC Media & Data from iMMovator

Beeld & Geluid: beeldherkenning kost nog steeds heel veel capaciteit

Roeland Ordelman, specialist in beeld- en geluidherkenning bij Beeld en Geluid vertelt over de grote sprongen in beeldherkenning. Het instituut probeert de collectie volledig doorzoekbaar te maken en uiteindelijk open te stellen voor gebruik in social media. Er kan al gezocht worden op geluid en via metatags. Via beeldherkenning kan in een testomgeving nu al gezocht worden op visuele herkenningspunten als ‘baard’. Er kan ook worden gezocht op personen, locatie of evenement. Het grote nadeel is de benodigde rekencapaciteit. Er wordt nu nog getest in 5.000 uur video. “Feature extractie in 150.000 uur video (nog steeds een fractie van de collectie van Beeld & Geluid) kost op de huidige infrastructuur 22 jaar reken.” Opschaling vraag nog veel academisch onderzoek en geld. Er is subsidie aangevraagd bij de Europese commissie.

Roeland Ordelman (Beeld & Geluid) @ CMC Media & Data from iMMovator

RTL: Data van alle platformen combineren voor betere intelligence

Geoffrey van Meer, Manager Consumer Intelligence, RTL Nederland vertelt over de wijze waarop RTL de relevantie van content wil vergroten en de inzet van content op alle beschikbare kanalen (YouTube, social media, online en offline) kan optimaliseren. RTL heeft een groot ecosysteem met een groot aantal bedrijven in broadcast, digital B-to-B (zoals Spotexchange), digital B-to-C (Videoland) en ventures. Alle bedrijven hebben eigen platforms met eigen datastromen. Om deze data te kunnen gebruiken, zijn alle datastromen bij elkaar geveegd (online en offline) binnen een platform. Dit platform wordt gebruikt om informatie te genereren op drie gebieden:

1. Marketing intelligence: RTL wil een directe relatie aangaan met de consument. De data bieden ingangen voor verdere segmentatie. Bij Videoland is bijvoorbeeld de doelgroep drama kijkende vrouwen gedefinieerd, waarop specifieke acties kunnen worden losgelaten. Binnen NLZiet kunnen ze aan predictive modelling doen (nemen mensen een proefabonnement en verlengen ze deze) op basis van het kijk en klik-gedrag.

2. Sales intelligence: op basis van data kunnen segmenten beter worden gevonden (bijv. mannen, autoliefhebbers) ten behoeve van adverteerders. “We vragen niet meer naar geslacht, maar kunnen op basis van gedrag zien of we met een man of een vrouw te maken hebben (look-a-like-modelling)”

3. Content intelligence: data kunnen worden gebruikt voor recommandatie, zoeken en inkoop. Recommendatie kan op filmtype, maar daarbinnen nog verfijnder op basis van de text mining van subtitles. RTL leest alle ondertiteling in om het woordgebruik in kaart te brengen en daar films beter op te matchen. Via face recognition kunnen ook acteurs worden herkend en films met deze acteurs worden aanbevolen. “Onze afdeling inkoop krijgt zo informatie over de categorie films waar mensen alles al hebben gezien en waar moeten worden bijgekocht.”

RTL is net begonnen, maar doel is om de losse componenten van RTL beter te verbinden en over 5 jaar een goede relatie tussen feiten en creatie te hebben opgebouwd.

Doorbraakproject Big Data

Gera Pronk, Projectmanager ICT doorbraakproject Big Data, brengt Doorbraakmetbigdata.nl onder de aandacht. Een driejarig initiatief van het ministerie van EZ in samenwerking met kennispartners om gebruik van big data door de kleinere ondernemers te stimuleren. “We kijken welke ondernemers al eerste gebaat zouden zijn met big data en selecteren deze in samenwerking met CBS en KvK.” Neem vooral contact op voor meer informatie.

Gera Pronk (Doorbraakproject Big Data) @ CMC Media & Data from iMMovator