beginnen met machine learning starten

Machine learning is een techniek waarmee je machines in staat stelt om te leren. Het betreft de toepassing van statistische concepten in een programmeertaal zoals Python, waardoor algoritmes voorspellingen kunnen doen op basis van historische data.

Maar beginnen met machine learning kan een beetje een doolhof zijn. Daarom in deze post de stappen die je kunt zetten om te starten met machine learning leren.

We behandelen de volgende onderwerpen:

  • Wat is machine learning en waarom is het belangrijk?
  • Bouwblok #1: leer Python
  • Bouwblok #2: leer statistiek
  • Discipline, eigen projecten, en geduld
  • Online of klassikaal?

Wat is machine learning en waarom is het belangrijk?

Met machine learning technieken leer je computers om zelfstandig waardevolle voorspellingen te doen voor nieuwe data. Dit kan op verschillende manieren. Zo zijn er algoritmes die zelfstandig leren en verbanden ontdekken, zonder menselijke supervisie. Dit noem je unsupervised learning. Ook zijn er algoritmes die je traint door aan te geven wat de uitkomst was, gegeven een bepaalde input. Dit noem je supervised learning. Machine learning is een belangrijk concept binnen het vakgebied dat data science wordt genoemd.

Het is belangrijk om zelf te starten met machine learning leren om diverse redenen. Zo kom je - zonder dat je het misschien door hebt - dagelijks al tientallen keren in aanraking met machine learning. Zo krijg je wanneer je iets Googelt, de meest relevante advertenties voor jou getoond op basis van machine learning. Of semi-zelfstandige Tesla's die algoritmes hebben die kunnen besluiten te remmen wanneer er zich een ongeval voordoet. Zelfs in je eigen huis worden tegenwoordig vaak slimme meters geïnstalleerd om energieverbruik te minimaliseren, bijvoorbeeld door automatisch te herkennen dat je op zondagmiddag nooit thuis bent en de verwarming dus uit kan.

Kortom, machine learning is overal en dat zal in de toekomst alleen nog maar toenemen. Maar hoe kun jij beginnen met machine learning? Hiertoe zien wij twee essentiële bouwstenen: kennis van Python en van statistiek.

Beginnen met machine learning bouwblok #1: leer Python

Wie machine learning modellen wil ontwikkelen ontkomt er niet aan om te leren programmeren. De dominante taal voor machine learning modellen is tegenwoordig Python. Dit komt omdat Python een veelzijdige en relatief eenvoudige programmeertaal is. Bovendien zijn er geavanceerde machine learning packages beschikbaar en is er een actieve gemeenschap die klaar staat om te helpen als je er even niet uitkomt.

Wie affiniteit heeft met analytische vaardigheden zal door zelfstudie op een niveau kunnen komen waarop je basis machine learning modellen kunt ontwikkelen en toepassen. Het is zaak om in ieder geval kennis op te doen van fundamentele programmeer-concepten als variabelen en data types, lists en dictionaries, en logica en functies. Daarnaast zul je ervaring op moeten doen met de packages Numpy, Python Pandas, en Matplotlib.

Deze basis bieden wij aan in onze tweedaagse Python cursus voor data science. Aan het einde van deze cursus ben je in staat om bijvoorbeeld Excel analyses te automatiseren en om geavanceerde visualisaties te maken.

Zelf machine learning modellen ontwikkelen? Schrijf je in voor een van onze data science trainingen.



Beginnen met machine learning bouwblok #2: leer statistiek

Voorspellingen die door machine learning modellen worden gedaan, worden altijd gedaan met behulp van statistische concepten. Zo kun je bijvoorbeeld met statistiek bepalen hoe groot de kans is dat iets gebeurt, of hoe waarschijnlijk het is dat jouw model een betrouwbare voorspelling doet.

Een solide basis in statistiek in daarom essentieel. Voor mensen die de universiteit hebben afgerond klinken concepten als een p-waarde, een normale verdeling, lineaire regressie (of de assumpties bij lineaire regressie), of een Z-waarde misschien nog enigszins bekend. Echter, voor veel mensen zal het opdoen of opfrissen van kennis van statistiek een redelijke kluif zijn.

Verdiep je in ieder geval in de volgende concepten:

  • Sampling en manieren om data te vergaren
  • Verschillende data types als categorisch, discreet, of continue
  • Gemiddelde, modus, mediaan, standaard afwijking, en variantie
  • Verschillende verdelingen van data zoals bijvoorbeeld normale verdeling of uniforme verdeling
  • Het opstellen van hypotheses en trekken van juist of verkeerde conclusies (Type 1 & Type 2 errors)
  • Testen op significantie en de p-waarde

Wanneer je deze basisideeën begrijpt kun je gemakkelijker duiken in relevante algoritmes voor Machine Learning. Zo kun je uiteindelijk een supervised machine learning model toepassen door midden van regressie of classificatie. Of een unsupervised model met een clustering algoritme. In deze post geven we een overzicht van machine learning packages die beschikbaar zijn in Python.

Omdat deze materie als taai of saai kan worden ervaren is het in onze ogen essentieel om het zo praktisch mogelijk te maken. Koop dus geen dik boek over statistiek, maar zoek naar manieren om aan de slag te gaan met statistiek. Dit kan bijvoorbeeld in online courses of in onze tweedaagse machine learning training.

Machine learning tutorials

Als je de basis op orde hebt kun je gaan oefenen met één van onze ML tutorials:

Discipline, eigen projecten, en een goed begin

Uiteindelijk is het goed leren beheersen van zowel Python als statistiek een discipline-kwestie; als je het écht wilt en actief blijft leren dan kom je er zeker. Dit kan lastig zijn als je het leert naast bijvoorbeeld een fulltime baan of naast een studie. Daarom volgen hier enkele tips waarvan wij hebben gemerkt dat ze goed werken:

  • Start met het leren van Python voordat je met statistiek aan de slag gaat. Wie alles tegelijk wil leren zal uiteindelijk niets leren. Stel jezelf daarom eerst als doel om Python beter te beheersen door bijvoorbeeld bepaalde taken of analyses te automatiseren. Als dat je steeds gemakkelijker afgaat kun je je gaan storten op statistiek. Werk dus stap voor stap vooruit en stel concrete en waardevolle doelen.
  • Zoek naar vaste momenten in de week waarop je hiermee bezig bent. Ga bijvoorbeeld iedere zaterdag een ochtend naar een cafe en leer gefocust verder. Door wekelijks bezig te blijven met de materie zul je over tijd grote vooruitgang boeken. Wat ook goed werkt is op je werk bespreekbaar maken dat dit een leerdoel is. Zo kun je kijken of er werkgerelateerde toepassingen zijn en kun je tijdens werktijd verder leren.
  • Alle begin is lastig, daarom adviseren wij om serieus tijd te investeren wanneer je start met het leren van machine learning. Ga dus niet een uurtje per week aan de slag, maar reserveer bijvoorbeeld een heel weekend of neem een week vrij. Vergelijk het met het lezen van een boek; daar kom je ook niet goed in als je steeds 10 pagina's leest.

Online of klassikaal?

Kom je net van de universiteit?
Voor mensen die blanco uit de collegebanken komen raden wij online trainingen aan. Je zult op een junior rol solliciteren en als je je vaardigheden online bijspijkert zul je een heel end komen. Ook ben je het nog gewend om zelfstandig veel nieuwe kennis op te doen en heb je waarschijnlijk nog niet zo'n drukke week als iemand die full-time werkt en een gezin heeft.

Wil je je omscholen/ doorontwikkelen?
Als je je wilt omscholen raden we je aan een klassikale training te volgen om de volgende redenen:

  • Je hebt al ervaring. Een ervaren data scientist kan je helpen om een logisch ontwikkelpad uit te stippelen. Voor een PhD zal dit pad er anders uitzien dan voor een marketeer.
  • Als je 2 dagen non-stop een klassikale training volgt dan bouw je basisvaardigheden op waarmee je vervolgens zelfstandig verder kunt.
  • Een klassikale training geeft focus naast een full-time baan of een gezin waardoor je snel de eerste meters maakt. En die eerste horde is het lastigst, want als je eenmaal analyses kunt doen wordt het steeds leuker en makkelijker.
  • Als je al in dienst bent heb je vaak een opleidingsbudget waar je gebruik van kunt maken.

Lees hier meer over online of klassikaal Python leren

Zelf machine learning modellen ontwikkelen? Schrijf je in voor een van onze data science trainingen.


Machine learning specialist worden?

Wil jij snel op stoom zijn met machine learning? Volg dan onze Data Science opleiding. In vier dagen nemen we je mee in de basis van Python en statistiek. Er is geen voorkennis vereist. Je leert zelfstandig machine learning modellen ontwikkelen en toepassen. Voor wie al ervaring heeft met programmeren in Python is het ook mogelijk om alleen de laatste twee dagen mee te doen; dit is onze machine learning training.

Download één van onze opleidingsbrochures voor meer informatie

by: