Genevieve Bell is Vice President Intel en één van de meest invloedrijke vrouwen in de technische industrie. Ze groeide op in Australië, waar ze een groot deel van haar jeugd doorbracht bij de inheemse bevolking, en studeerde antropologie. Ze werd 16 jaar geleden door Intel gevraagd om het bedrijf te helpen bij onderzoek naar de wijze waarop mensen technologie gebruiken. Als Director of Interaction and Experience Research van Intel Labs leidt ze een team van 120 sociaal wetenschappers, interaction deginers, human factors engineers en computerweterschappers. “We onderzoeken wat mensen bezighoudt. Wat willen ze voor zichzelf, voor elkaar en voor hun community betekenen? En hoe kunnen we ze helpen die behoeftes vorm te geven.” Big data zijn daarin een belangrijk hulpmiddel. Maar dan wel vanuit een zorgvuldig opgesteld en verantwoord kader, stelt Genevieve.
Ze geeft een korte toelichting op haar visie op big data aan de hand van het Engelse Domesday book. Willem de Bastaard veroverde in 1066 Engeland met de slag bij Hastings. Hij verbleef echter weinig in Engeland. Toen hem een kleine jaar later de oorlog werd verklaard, wist hij bijna niets van zijn land. Niet hoeveel man hij ter beschikking had, hoeveel eten er was, hoeveel land en hoeveel vee en voor het innen van belasting was het belangrijk te weten hoeveel land iemand bezat. Hij maakte een vragenformulier met 20 vragen en vroeg aan landeigenaren deze in te vullen en terug te sturen. Hij ontving 13.000 formulieren. Alleen al door het invullen van het formulier ontstonden overal in het land geschillen over landbezit. Een Koninklijk team ging het land door om geschillen te beslechten en land op waarde te schatten. Vanaf dat moment stonden landeigenaren en hun bezit vast. Alles werd genoteerd in een boek: Domesday book. Aan de hand van het boek kon de koning belasting heffen. Bell stelt dat het Domesday book een van de eerste big data-projecten was. Voor haar is ‘big data’ een aanduiding voor drie afzonderlijke activiteiten: datacollectie (de survey), analytics en visualisatie (gestructureerd opschrijven in een boek) en het gebruik van algoritmes om uiteindelijk waarde te creëren (belasting heffen).”
Zwakke schakel in het hele proces van verzamelen, visualiseren en waardecreatie, is de mens zelf, volgens Bell. Bij de datacollectie worden keuzes gemaakt. In het Domesday boek is bijvoorbeeld voornamelijk informatie over land en landeigenaren verzameld, maar het zegt niets over de bevolking: “Er zijn geen gegevens over vrouwen.” Bij de dataselectie moet ook duidelijk zijn waar feiten vandaan komen en hoe ze zijn verzameld. “Je kunt er niet vanuit gaan dat data altijd waar zijn. Mensen zeggen soms bewust niet de waarheid.”
Dan komt de analysefase. “Ook dat vraagt keuzes: welke data worden gekoppeld?” Bell geeft het voorbeeld van een cholera-uitbraak in Engeland. Toen het aantal doden door cholera steeg, brak er paniek uit in het land. Toen later de koppeling met locatie werd gemaakt, werd duidelijk dat de uitbraak in een klein gebied was. “We moeten leren de goede vragen te stellen.”
Tot slot de algoritmes. Bell geeft een voorbeeld waarbij iemand een algoritme maakte voor het bepalen van de meest invloedrijke persoon ter wereld. In het algoritme speelden social media een grote rol. Op basis van het algoritme bleek Justin Bieber de meest invloedrijke persoon ter wereld te zijn en niet – zoals aangenomen – iemand als Warren Buffet. Er was een aanname gemaakt dat retweeten en liken iets zegt over invloed. “Algoritmes zijn in zichzelf heel effectief, maar je maakt aannames over welke gegevens met elkaar in relatie staan. Daarin kun je dus ook iets missen.” In algoritmes zitten onbewust de oordelen en aannames van de programmeurs en analisten verwerkt.
De potentieel destructieve invloed van (onbewuste) aannames en oordelen mogen niet worden onderschat volgens Bell. Zeker niet nu algoritmes een fysieke vorm gaan krijgen, bijvoorbeeld in de vorm van zelfsturende auto’s, en zelf beslissingen gaan nemen. “Maar wat nu als opeens een kangoeroe voor de auto springt en de auto moet uitwijken en het niet te voorkomen is dat één persoon zal sterven: de bestuurder, de bijrijder of een toevallige wandelaar. Welke keuze wordt er dan gemaakt?” Voor Genevieve Bell is het een uitgemaakte zaak dat dergelijke beslissingen niet aan de data-analist of programmeur kan worden overgelaten. “Dit gaat over morele, culturele en ethische zaken. Daarvoor is een multidisciplinair team nodig waar niet alleen technologen, maar ook bijvoorbeeld politici, kunstenaars en designers deel van uit maken.”
Op een vraag uit de zaal noemt Bell meer issues die goed geregeld moeten zijn voor verantwoord gebruik van big data, waaronder veiligheid van gegevens, privacy, rechten en ethiek (mogen data ook voor andere doeleinden worden gebruikt dan waarvoor ze zijn verzameld). “Data en algoritmes gaan over macht. Je ziet het aan koning Willem die het Domesday book maakte om zijn land te inventariseren, maar het ging gebruiken om belasting te innen. Het verschil is dat Willem burgers liet participeren en iedereen begreep waar de datacollectie toe zou leiden. Nu ontstaan digitale Domesday boeken en zijn we helemaal niet betrokken.”
Genevieve Bell (Intel) was in Nederland voor de Media Future Week, een innovatie-event voor 120 topstudenten van Nederlandse hogescholen.
Bekijk hier de slides van Genevieve: