Data Science in het onderwijs

23-11-2016

Door: Talko Dijkhuis & Luuk Stemers, Hanzehogeschool Groningen

Talko Dijkhuis ontwikkelde modules voor de opleiding Data Science van de IT Academy voor professionals. Actuele onderwerpen als Predictive Analysis en Machine Learning staan volgend jaar in het curriculum van Hanze opleiding HBO-ICT (major Business IT & Management). 

"De laatste decennia zie je een exponentiële stijging van het aantal data dat dagelijks via internet en  sensoren op ons afkomt. Overal worden big data gegenereerd, denk maar aan ruimtetelescopen, sensoren in auto’s, weersatellieten, verkeerscamera’s en klant- en verkoopgegevens van webwinkels. Op de één of andere manier moeten al die data worden geanalyseerd en verwerkt zodat je er relevante informatie uit haalt. Er is veel vraag naar mensen die dat kunnen."

Talko Dijkhuis is Hogeschooldocent Business IT & Management bij HBO-ICT. Op het lectoraat New Business & ICT doet hij onderzoek naar de combinatie van Health en Data Science. Daarnaast geeft hij les op de IT Academy die twee jaar geleden werd opgezet om IT-talent te behouden voor de regio en een impuls te geven aan nieuwe IT-ontwikkelingen in het Noorden."Op de IT Academy ben ik verantwoordelijk voor de inhoud van de opleiding Data Science. Die kent een laagdrempelige variant die negen maanden duurt. De vervolgopleiding is voor ervaren IT’ers, Advanced Data Science. We bedenken de structuur en de onderwerpen. De opleiding wordt gegeven door docenten van de Hanze en de Rijksuniversiteit en door externen."


Voorspellen in de auto

Naast meer traditionele onderwerpen als business intelligence, datavisualisatie, komen er ook nieuwe IT-disciplines aan de orde. Eén van de belangrijkste nieuwe onderwerpen in het programma is Predictive Analysis. "Netflix doet dat, bijvoorbeeld. Je hebt een aantal films bekeken en op basis daarvan krijg je aanbevelingen voorgeschoteld, films die je waarschijnlijk ook goed vindt. Dat gebeurt via Predictive Analysis."


Veel organisaties kunnen met Predictive Analysis hun voordeel doen. "We hebben veel cursisten van de RDW. Daar willen ze een afdeling data science oprichten. Ik zou me zo kunnen voorstellen dat ze daar Predictive Analysis gaan toepassen. Zo zou je mensen die net een rijbewijs hebben, kunnen volgen via de data die hun auto’s genereren over bijvoorbeeld remgedrag en acceleratie. Je kunt dan bijvoorbeeld vaststellen of iemand op bepaalde punten nascholing nodig heeft."


Talko Dijkhuis trekt de mouw van z’n overhemd op. Een donkere kunststofarmband komt tevoorschijn. "Een fitbit, een activity tracker, die van moment tot moment bijhoudt hoeveel ik beweeg. Ik volg een promotietraject op de RUG naar het geautomatiseerd analyseren van bewegingsdata om patronen en afwijkingen te vinden, ook dat is Predictive Analysis. Als je een groep mensen met obesitas allemaal een fitbit geeft, kun je in kaart brengen hoeveel en wanneer ze bewegen. Je kunt zien hoe die patronen veranderen nadat ze een coachingsprogramma volgen. Met zulke gegevens kun je vervolgens voorspellingen doen voor groepen mensen met obesitas in het algemeen." 


Wie is de kat?

Dijkhuis en een paar collega’s van de IT Academy bouwen momenteel uitgebreide casuïstiek over dit soort onderwerpen op. Hij verwacht dat ook het reguliere onderwijs (van HBO-ICT) van deze aan de IT Academy ontwikkelde lesstof zal profiteren. "We reviseren momenteel de major Business IT & Management. We willen datagerichte consultants opleiden. De modules over Predictive Analysis zijn daarvoor zeer geschikt. Volgend jaar zijn de eerste studenten van de major zover dat ze de modules kunnen volgen." 

Ook veel van de lesinhoud over het zogeheten Machine Learning die de IT Academy ontwikkelt zal naar Dijkhuis’ overtuiging in het curriculum van de major Business IT & Management terechtkomen. Machine Learning is een manier om data volledig automatisch te verwerken. Daarbij maak je gebruik van neurale netwerken die zijn getraind door miljoenen voorbeelden te laten zien totdat het netwerk de juiste classificaties geeft. "Google is momenteel bezig met zo’n neuraal netwerk dat je bijvoorbeeld kunt trainen door het dierenfoto’s aan te bieden en daarbij telkens aangeeft of het al of niet om een kat gaat. Gezichtsherkenningssoftware werkt ook op die manier. In tegenstelling tot wat vaak wordt gedacht staat Machine Learning nog maar in de kinderschoenen. Laat je aan het systeem een onscherpe kattenfoto zien, of een plaatje van een poes schuin van boven, in plaats van recht van voren, dan zijn de uitkomsten nog behoorlijk onvoorspelbaar."

Snel groeiende datastromen

Op Facebook worden via Machine Learning Filters gemaakt die naaktfoto’s uit pagina’s moeten verwijderen. Ook dat gaat nog weleens fout. Zo was onlangs in het nieuws dat de beroemde oorlogsfoto uit 1972, van het voor napalm vluchtende naakte Vietnamese, werd weggefilterd. "Dat geeft aan hoe moeilijk het nog is dit soort technologie honderd procent betrouwbaar te maken. Maar het is een ontwikkeling die zeker doorgaat en die ook nodig is, als we vat willen blijven houden op de snel groeiende datastromen die er op ons afkomen."


Talko Dijkhuis MSc

Hoofddocent Data Science bij IT Academy Noord-Nederland
Hoofddocent Data Science bij IT Academy Noord-Nederland

Luuk Steemers MSc

Redacteur bij Hanzehogeschool Groningen
Redacteur bij Hanzehogeschool Groningen
  • Deel