28 februari 2021
AI machine learning onderzoek Data Tech

Onderzoek: datasets struikelblok bij toepassen AI

Foto: Unsplash
Laatste update: 21 mrt '21 - 10:10

De meeste bedrijven hebben moeite om een succesvolle aanpak te ontwikkelen voor het toepassen van AI. Maar 20 procent heeft volwassen projecten op het gebied van AI en machine learning. Dat blijkt uit een enquête van Rackspace Technology. Veel bedrijven zijn nog aan het uitzoeken hoe ze het best met AI kunnen werken. Het grootste struikelblok blijkt de beschikbaarheid van goede datasets.

Cloud computing

Voor machine learning zijn twee dingen nodig: rekenkracht van computers en data. Dankzij diverse cloud computing-platforms is de hardware nodig voor het trainen van AI-modellen, veel toegankelijker en betaalbaarder. Maar data blijven een hindernis voor het plannen en invoeren van een AI-strategie. Volgens 34 procent van de bedrijven is de slechte kwaliteit van data de belangrijkste reden voor het mislukken van onderzoek en ontwikkeling op het gebied van machine learning. Nog eens 31 procent zegt niet over productieklare datasets te beschikken.

Bij het toepassen van machine learning in de praktijk is dit een groot probleem. AI-onderzoekers hebben toegang tot vele openbare datasets voor het trainen en testen van hun machine learning-modellen. Veel bedrijven en organisaties beschikken niet of onvoldoende over zulke kwaliteitsdata. Dat geldt met name voor de industrie, de gezondheidszorg en de overheid, waar data schaars zijn of aan strenge regels zijn onderworpen. Ook in de mediasector is de beschikbaarheid van goede datasets niet vanzelfsprekend.

Toegang tot talent

Het tweede probleem voor de meeste bedrijven is de toegang tot talent op het gebied van machine learning en data science. Volgens het onderzoek van Rackspace is het ontbreken van interne deskundigheid de op een na grootste oorzaak van het mislukken van AI-projecten. Dat geldt met name voor kleinere bedrijven. Die kunnen niet de data scientists en ontwikkelaars aantrekken die AI-modellen kunnen ontwikkelen.

Hoewel het tekort aan talent in machine learning en data science bekend is, blijft de behoefte aan meer data-ontwikkelaars vaak onopgemerkt. Dit zijn de mensen die databases, datawarehouses en data lakes opzetten en onderhouden. Volgens het onderzoek van Rackspace mislukken veel projecten omdat bedrijven niet het talent in huis hebben om hun data-infrastructuur aan te passen voor machine learning.

Aan de enquête van Rackspace Technology deden bijna 1.900 IT-managers uit de hele wereld mee. Het complete onderzoek is hier (in pdf) te downloaden.