Opleiding R

R is steeds meer één van de standaard vaardigheden voor data scientists. In deze opleiding R voor data science leer je hoe je met R data importeert uit verschillende bronnen, en hoe je data verkent en analyseert. Ook leer je om opgedane inzichten te visualiseren.

R bevat tevens diverse handige data science 'packages'. In bijna iedere data science vraagstuk maak je als data scientist gebruik van deze modules, vandaar dat we de meest populaire modules uitgebreid behandelen.

Omdat R een laagdrempelige programmeertaal is, hoef je niet te kunnen programmeren om mee te kunnen doen met deze cursus. In deze cursus leer je hoe je met de veelzijdige taal R gegevens kunt importeren, opschonen, manipuleren en visualiseren - allemaal onmisbare vaardigheden voor elke aankomende Data Scientist of onderzoeker. Door middel van interactieve oefeningen krijg je hands-on met een paar van de populairste R pakketten, waaronder ggplot2, dplyr en readr. Daarna werk je met echte datasets om de technieken te leren die je nodig hebt in jouw toekomst als Data Scientist.

In deze opleiding R wisselen we een klassikale presentatie (begrijpen) af met opdrachten (toepassen) in onze eigen online omgeving. Direct tijdens de eerste ochtend schrijf en run je eigen R scripts.

opleiding r cursus r van data science partners

Leerdoelen van de opleiding R

R voor data science basiskennis en vaardigheden

We laten je zien waarom R in veel gevallen de beste keuze is voor data science vraagstukken. Je leert de belangrijkste packages en oefent met het zelfstandig schrijven van scripts. De mix van theorie en oefening zorgt ervoor dat je de stof uit de training goed onthoudt.

Verbinden met en transformeren van datasets

Je leert hoe je kunt verbinden met verschillende soorten databronnen. Je combineert, transformeert, en verrijkt de data uit deze bronnen waardoor nieuwe inzichten ontstaan. Bovendien leert je hoe je terugkerende handelingen automatiseert waardoor je minder fouten maakt en efficiënter werkt.

Inzichten visualiseren en rapporteren

Je leert hoe je jouw waardevolle inzichten het beste deelt met anderen. Dit kun je doen in automatische rapportages met sprekende gepersonaliseerde grafieken. Een beeld brengt in veel gevallen een boodschap krachtiger over.

Wanneer kies ik voor deze opleiding R?

Deze cursus is voor mensen die:

  • Dagelijks met data werken
  • Rapportages of analyses willen automatiseren
  • Tijd willen besparen in terugkerende analyses
  • Fouten willen voorkomen in terugkerende analyses
  • Meer willen dan de standaardfunctionaliteit in programma's als Excel
  • Over data science hebben gehoord willen snappen wat dit inhoudt

Benodigde voorkennis

Je hoeft niet te kunnen programmeren om aan deze cursus mee te doen. Wel is het handig als je minimaal HBO hebt afgerond en regelmatig met Excel-bestanden of databases werkt.

Programma van de opleiding R

Dag 1: R voor data science basisvaardigheden

Onderdeel 1: Algemene introductie in R en Data Science

We starten de training met een inkijkje in de ontstaansgeschiedenis van R. We behandelen de belangrijkste kenmerken van de taal en daarmee wordt duidelijk waarom R en data science zo'n goede match zijn. In onze eigenlijk online omgeving schrijf je direct de eerste ochtend een eigen script. In onze online omgeving werk je in de applicatie RStudio. Dit is één van de populairste applicaties om R scripts mee uit te voeren. Het is daarom zeer waardevol dat je hier direct ervaring mee opdoet.

Onderdeel 2: Welke data types kent R en wat zijn variabelen?

Verschillende soorten data krijgen hun eigen datatype mee in R. Zo heeft tekst andere kenmerken binnen R dan bijvoorbeeld getallen. Je leert de verschillen tussen diverse data types en oefent hiermee. Verder leer je dat je met variabelen een naam kunt toewijzen aan een data-element. Deze variabele kun je vervolgens blijven gebruiken in het script.

Onderdeel 3: Wat kun je met lists?

Als je met data werkt dan zul je zelden met één datapunt te maken hebben. Je hebt vrijwel altijd grote hoeveelheden data tot je beschikking. Met een list kun je een reeks van datapunten opslaan. Je leert hoe je bewerkingen op lists doet en wanneer je het best een list gebruikt.

Onderdeel 4: Werken met Apply

R is ontwikkeld om te kunnen werken met grote datasets. Om deze reden zijn er methoden ingebouwd die het werken met grote sets versimpelen en efficiënter maken dan for- en while-loops. Als je een for loop gebruikt, is het misschien verstandig om je code te verbeteren en te kijken of je in plaats daarvan de lapply functie kunt gebruiken. Leer alles over deze intuïtieve manier om een functie toe te passen op een lijst of een vector, en hoe je de varianten, sapply en vapply, kunt gebruiken.

Onderdeel 5: Functies en logica

Data analyses zitten vol met logica (e.g. <, >, !=, etc). We leggen uit hoe logica in R werkt en wanneer en hoe je het toepast. Verder gaan we in op hoe je eigen functies schrijft voor handelingen die terugkerend zijn. Zo kun je foutloos en snel repetitieve activiteiten uitvoeren.

impressie van de opleiding R voor data analyse

Dag 2: De meestgebruikte R tools voor data science

Onderdeel 6: Data Importeren met R

Het importeren van data in R zou de simpelste stap in je analyse moeten zijn. Helaas is dat bijna nooit het geval. Weten welke aanpak je moet gebruiken, is de sleutel om aan de slag te gaan met de eigenlijke analyse. Je leert hoe je verschillende bestanden kunt lezen in R. Bovendien leer je hoe met de packages readr en data.table op een eenvoudige manier gegevens uit bestanden te importeren. Ook leer je hoe je Excel bestanden kunt importeren in R met readxl en gdata.

Onderdeel 7: het package DPLYR gebruiken

Binnen R is dplyr het meestgebruikte data science package. En dat is om goede redenen, want je kunt in dplyr alles doen wat je met Excel kan en nog veel meer. Bijvoorbeeld tools om data te verkennen, te bewerken, te combineren, te filteren of te groeperen. Tijdens jouw data-analyses zul je voortdurend gebruikmaken van functionaliteiten die dplyr biedt.

Onderdeel 8: Mooie visualisaties maken met Ggplot2

Het vermogen om zinvolle en mooie data visualisaties te produceren is een essentieel onderdeel van jouw vaardigheden als data wetenschapper. Je leert de principes en werkwijze achter goede visualisaties geïmplementeerd met het package ggplot2. Dit package de go-to tool voor flexibele en professionele plots in R. Tegen het einde van de cursus zal je in staat zijn om complexe exploratieve plots te maken.

Onderdeel 9: Het geleerde toepassen in een eindopdracht

Deze R cursus eindigt met het toepassen van al het geleerde in een eindopdracht. Je verbindt met meerdere databronnen, transformeert de data, vindt door toepassing van logica en functies waardevolle informatie. Dit geef je weer in overzichtelijke tabellen en visualisaties.

Niet alleen maar een cursus

We willen dat jij je ontwikkelt tot top data scientist. Daarvoor is deze cursus een perfecte eerste stap, maar wij zijn ook realistisch. Je zult na de cursus zelfstandig aan de slag moeten in de praktijk en voortdurend door moeten blijven leren. Ons vakgebied staat namelijk nooit stil. Hier dragen we zorg voor op twee manieren.

opleiding_r_boek

Na afloop van de training ontvangt iedere deelnemer deze Data Science klassieker.

python cursus voor data science alumni meetups

Als oud-deelnemer kun je kosteloos deelnemen aan onze jaarlijkse Data Science inspiratie meetup.

Let op: bovenstaande twee extra's gelden voor deelnemers aan de open inschrijving en niet voor in-company groepen.

Ervaringen met onze R trainingen

2 dagen€950 ex. BTW
BCN Utrecht of in-company
- 13 & 14 september 2021- 8 & 9 november 2021- 10 & 11 januari 2022
09:30 - 16:30