Opleiding R
R is steeds meer één van de standaard vaardigheden voor data scientists. In deze opleiding R voor data science leer je hoe je met R data importeert uit verschillende bronnen, en hoe je data verkent en analyseert. Ook leer je om opgedane inzichten te visualiseren.
R bevat tevens diverse handige data science 'packages'. In bijna iedere data science vraagstuk maak je als data scientist gebruik van deze modules, vandaar dat we de meest populaire modules uitgebreid behandelen.
Omdat R een laagdrempelige programmeertaal is, hoef je niet te kunnen programmeren om mee te kunnen doen met deze cursus. In deze cursus leer je hoe je met de veelzijdige taal R gegevens kunt importeren, opschonen, manipuleren en visualiseren - allemaal onmisbare vaardigheden voor elke aankomende Data Scientist of onderzoeker. Door middel van interactieve oefeningen krijg je hands-on met een paar van de populairste R pakketten, waaronder ggplot2, dplyr en readr. Daarna werk je met echte datasets om de technieken te leren die je nodig hebt in jouw toekomst als Data Scientist.
In deze opleiding R wisselen we een klassikale presentatie (begrijpen) af met opdrachten (toepassen) in onze eigen online omgeving. Direct tijdens de eerste ochtend schrijf en run je eigen R scripts.
Leerdoelen van de opleiding R
R voor data science basiskennis en vaardigheden
We laten je zien waarom R in veel gevallen de beste keuze is voor data science vraagstukken. Je leert de belangrijkste packages en oefent met het zelfstandig schrijven van scripts. De mix van theorie en oefening zorgt ervoor dat je de stof uit de training goed onthoudt.
Verbinden met en transformeren van datasets
Je leert hoe je kunt verbinden met verschillende soorten databronnen. Je combineert, transformeert, en verrijkt de data uit deze bronnen waardoor nieuwe inzichten ontstaan. Bovendien leert je hoe je terugkerende handelingen automatiseert waardoor je minder fouten maakt en efficiënter werkt.
Inzichten visualiseren en rapporteren
Je leert hoe je jouw waardevolle inzichten het beste deelt met anderen. Dit kun je doen in automatische rapportages met sprekende gepersonaliseerde grafieken. Een beeld brengt in veel gevallen een boodschap krachtiger over.
Ervaringen met onze trainingen
Christiaan over onze Python cursus voor data science.
John over onze 4-daagse Data Science Opleiding.
Mandy over onze 10-daagse Data Science Bootcamp.
Wanneer kies ik voor deze opleiding R?
Deze cursus is voor mensen die:
- Dagelijks met data werken
- Rapportages of analyses willen automatiseren
- Tijd willen besparen in terugkerende analyses
- Fouten willen voorkomen in terugkerende analyses
- Meer willen dan de standaardfunctionaliteit in programma's als Excel
- Over data science hebben gehoord willen snappen wat dit inhoudt
Benodigde voorkennis
Je hoeft niet te kunnen programmeren om aan deze cursus mee te doen. Wel is het handig als je minimaal HBO hebt afgerond en regelmatig met Excel-bestanden of databases werkt.
Programma van de opleiding R
Dag 1: R voor data science basisvaardigheden
Onderdeel 1: Algemene introductie in R en Data Science
We starten de training met een inkijkje in de ontstaansgeschiedenis van R. We behandelen de belangrijkste kenmerken van de taal en daarmee wordt duidelijk waarom R en data science zo'n goede match zijn. In onze eigenlijk online omgeving schrijf je direct de eerste ochtend een eigen script. In onze online omgeving werk je in de applicatie RStudio. Dit is één van de populairste applicaties om R scripts mee uit te voeren. Het is daarom zeer waardevol dat je hier direct ervaring mee opdoet.
Onderdeel 2: Welke data types kent R en wat zijn variabelen?
Verschillende soorten data krijgen hun eigen datatype mee in R. Zo heeft tekst andere kenmerken binnen R dan bijvoorbeeld getallen. Je leert de verschillen tussen diverse data types en oefent hiermee. Verder leer je dat je met variabelen een naam kunt toewijzen aan een data-element. Deze variabele kun je vervolgens blijven gebruiken in het script.
Onderdeel 3: Wat kun je met lists?
Als je met data werkt dan zul je zelden met één datapunt te maken hebben. Je hebt vrijwel altijd grote hoeveelheden data tot je beschikking. Met een list kun je een reeks van datapunten opslaan. Je leert hoe je bewerkingen op lists doet en wanneer je het best een list gebruikt.
Onderdeel 4: Werken met Apply
R is ontwikkeld om te kunnen werken met grote datasets. Om deze reden zijn er methoden ingebouwd die het werken met grote sets versimpelen en efficiënter maken dan for- en while-loops. Als je een for loop gebruikt, is het misschien verstandig om je code te verbeteren en te kijken of je in plaats daarvan de lapply functie kunt gebruiken. Leer alles over deze intuïtieve manier om een functie toe te passen op een lijst of een vector, en hoe je de varianten, sapply en vapply, kunt gebruiken.
Onderdeel 5: Functies en logica
Data analyses zitten vol met logica (e.g. <, >, !=, etc). We leggen uit hoe logica in R werkt en wanneer en hoe je het toepast. Verder gaan we in op hoe je eigen functies schrijft voor handelingen die terugkerend zijn. Zo kun je foutloos en snel repetitieve activiteiten uitvoeren.
Dag 2: De meestgebruikte R tools voor data science
Onderdeel 6: Data Importeren met R
Het importeren van data in R zou de simpelste stap in je analyse moeten zijn. Helaas is dat bijna nooit het geval. Weten welke aanpak je moet gebruiken, is de sleutel om aan de slag te gaan met de eigenlijke analyse. Je leert hoe je verschillende bestanden kunt lezen in R. Bovendien leer je hoe met de packages readr en data.table op een eenvoudige manier gegevens uit bestanden te importeren. Ook leer je hoe je Excel bestanden kunt importeren in R met readxl en gdata.
Onderdeel 7: het package DPLYR gebruiken
Binnen R is dplyr het meestgebruikte data science package. En dat is om goede redenen, want je kunt in dplyr alles doen wat je met Excel kan en nog veel meer. Bijvoorbeeld tools om data te verkennen, te bewerken, te combineren, te filteren of te groeperen. Tijdens jouw data-analyses zul je voortdurend gebruikmaken van functionaliteiten die dplyr biedt.
Onderdeel 8: Mooie visualisaties maken met Ggplot2
Het vermogen om zinvolle en mooie data visualisaties te produceren is een essentieel onderdeel van jouw vaardigheden als data wetenschapper. Je leert de principes en werkwijze achter goede visualisaties geïmplementeerd met het package ggplot2. Dit package de go-to tool voor flexibele en professionele plots in R. Tegen het einde van de cursus zal je in staat zijn om complexe exploratieve plots te maken.
Onderdeel 9: Het geleerde toepassen in een eindopdracht
Deze R cursus eindigt met het toepassen van al het geleerde in een eindopdracht. Je verbindt met meerdere databronnen, transformeert de data, vindt door toepassing van logica en functies waardevolle informatie. Dit geef je weer in overzichtelijke tabellen en visualisaties.
(OPTIONEEL) Dag 3: Statistiek in R
Ontdek de wereld van statistiek met R in deze optionele derde dag. Leer hoe je beschrijvende statistieken berekent, associatietests uitvoert, vergelijkingstests toepast en voorspellende technieken gebruikt om diepgaande inzichten te verkrijgen. Deze leerervaring zal je in staat stellen statistische analyses effectief uit te voeren met behulp van R. Hierdoor kun je je analytische vaardigheden aanzienlijk versterken. Schrijf je in en laat statistiek met R een krachtige tool worden in jouw set vaardigheden.
- Beschrijvende statistieken
- Bereken statistieken zoals verschillende gemiddelden, minima, maxima, en standaardafwijkingen.
- Associatietests
- Toon aan of er een relatie bestaat tussen variabelen.
- Dit met bijvoorbeeld een Pearson correlatie coëfficiënt of een Chi-squared test.
- Vergelijkingstests
- Vergelijk of variabelen verschillend van elkaar zijn.
- Dit met bijvoorbeeld een T-test, ANOVA, of een Mann-Whitney test.
- Voorspellende technieken
- Modeleer de relatie tussen variabelen en verkrijg hiermee inzichten.
- Dit met bijvoorbeeld lineaire regressie.
Let op: voor deze training is voorkennis vereist van statistiek. De nadruk ligt op het uitvoeren van statistische analyses in R, niet op de statistische analyses zelf.
Niet alleen maar een cursus
We willen dat jij je ontwikkelt tot top data scientist. Daarvoor is deze cursus een perfecte eerste stap, maar wij zijn ook realistisch. Je zult na de cursus zelfstandig aan de slag moeten in de praktijk en voortdurend door moeten blijven leren. Ons vakgebied staat namelijk nooit stil. Hier dragen we zorg voor op twee manieren.
Na afloop van de training ontvangt iedere deelnemer het ultieme naslagwerk (ruim 100 pagina's) zodat je na de training altijd terug kunt kijken hoe alles werkt.
Als oud-deelnemer kun je kosteloos deelnemen aan onze jaarlijkse Data Science inspiratie meetup.
Locatie, data, en tijden
Deze Opleiding R verzorgen we in Utrecht, Amsterdam, en Eindhoven. Alle ingeplande data en locaties vind je in het eerste veld van het inschrijfformulier (zie hier voor de 2-daagse en hier voor de 3-daagse opleiding). Trainingsdagen binnen om 09:30 en duren tot uiterlijk 16:30.
Download de brochure voor de opleiding R
Ben je geïnteresseerd maar wil je je niet direct inschrijven? Download dan de opleidingsbrochure en denk er rustig over na. Bij vragen kun je ons bereiken op 020 - 24 43 146. We helpen je graag verder.
Onze klanten
€995 of €1495
Incl. alle cursusmaterialen
Excl. BTW
Amsterdam
Eindhoven
of in-company
optionele 3e dag• 21, 22 (& 25) nov 2024
• 6, 7 (& 8) jan 2025
• 5, 6 (& 7) mrt 2025
• 14, 15 (& 16) mei 2025
• 7, 8 (& 9) juli 2025