Wat is data science?
Data science is een vakgebied dat gericht is op het verkrijgen van inzichten uit data. Data scientists gebruiken programmeervaardigheden, statistische kennis, en sector- en organisatiekennis om verbanden te leggen en waardevolle inzichten te destilleren.
Eigenlijk wat de dame op de foto hierboven doet, maar dan digitaal. En tegenwoordig vervangen we deze dame steeds vaker door een algoritme die de analyse overneemt. Maar daarover later meer.
Dit artikel geeft een volledig overzicht en uitleg van wat data science is. De volgende onderdelen komen voorbij:
- Data science betekenis nader toegelicht
- De voordelen van data science voor jouw organisatie
- Data science met Python
- De toekomst van data science
- Hoe start ik met data science leren?
Data science betekenis nader toegelicht
De vraag "wat is data science" wordt - doordat het een opkomend vakgebied is - door verschillende personen op een verschillende manier beantwoord. Wij houden een definitie aan in lijn met bovenstaande afbeelding, waarin data science een combinatie is van de vakgebieden (1) wiskunde en statistiek, (2) programmeervaardigheden, en (3) sector- en organisatiekennis.
Allereerst zijn wiskunde en statistiek van belang voor data science, omdat data bijna altijd komen in de vorm van getallen. En als je het over het verwerken van getallen hebt, heb je het al snel over wiskunde en statistiek. Als data scientist is deze kennis dus onmisbaar. Je zoekt naar waardevolle inzichten binnen cijfermatige data, en om aan te tonen dat bepaalde inzichten écht zo zijn zul je statistische significantie aan moeten tonen. Daarvoor is kennis van statistiek belangrijk. Bovendien is kennis van kunstmatige intelligentie en machine learning een onderdeel waar veel statistische kennis bij komt kijken (e.g. Linear Regression, clustering, classificatie).
Ten tweede zijn programmeervaardigheden nodig binnen data science. Veel data moet ontsloten worden uit systemen die overheden of organisaties gebruiken. Dit doe je bijvoorbeeld met SQL, een programmeertaal (lees ook Python vs SQL). Als je de data die je zocht hebt gevonden kun je met bijvoorbeeld Python een data analyse uitvoeren. Binnen het vakgebied van data science verkiest men Python veelal boven programma's als Excel, omdat deze programma's beperkingen met zich meebrengen op het gebied van zowel functionaliteit als rekenkracht (lees ook Python vs Excel).
Tenslotte zijn sector- en organisatiekennis zeer belangrijk. Er zijn zoveel data beschikbaar dat je erin zult verdwalen als je de context van de data niet begrijpt. Door gericht experimenten op te zetten vergaar je sneller inzichten en ben je in staat meer waarde te leveren. Daarnaast zul je moeten begrijpen hoe jouw organisatie werkt als je de waardevolle inzichten in wilt zetten om organisatieveranderingen door te voeren. Soft-skills als communiceren, presenteren, onderhandelen, en overtuigen zijn hierin van belang.
Ook interessant: data analyst vs data scientist: wat zijn de verschillen?
De voordelen van data science voor jouw organisatie
Data science kent toepassingen in alle sectoren en organisaties waar aanzienlijke hoeveelheden data aanwezig zijn. Omdat dit tegenwoordig in ongeveer iedere organisatie zo is, is data science voor iedereen relevant. Dit klinkt een beetje flauw, maar het is echt zo.
Je kunt je vast wel wat voorstellen bij de volgende concrete toepassingen die allemaal gebaseerd zijn op data science algoritmes:
- Een krant verliest dagelijks abonnees. Met een slim data science model kun je (1) analyseren hoe het komt dat mensen opzeggen, (2) voorspellen wie er binnenkort gaan opzeggen, en (3) pro-actieve maatregelen adviseren om mensen bij de krant te houden. Lees hier meer over data science in marketing.
- Je hebt een webshop en wilt niet veel duurder of goedkoper zijn dan concurrenten. Dankzij data science kunnen webshops geautomatiseerd prijzen dynamisch aanpassen op omgevingsfactoren.
- Een thuiszorgmedewerker wil zo veel mogelijk tijd bij cliënten hebben en zo min mogelijk onderweg zijn, want dan gaat kostbare tijd verloren. Routeoptimalisatie algoritmes zijn een typische data science aangelegenheid. Leer hier meer over data science in de zorg.
- Wanneer je naar organisaties belt of online een chat start, zul je steeds vaker met een robot te maken krijgen. Deze werken misschien nog niet altijd even goed, maar doordat we veel interactie hebben met deze robots trainen we ze om ons beter te kunnen helpen. Ook dit is data science.
- Op de beurs wordt er meer volume verhandeld door data science algoritmes dan door mensen.
- Persoonlijke aanbevelingen in jouw favoriete webshops worden gedaan door algoritmes ontwikkeld door data scientists.
- Binnen grote organisaties wordt data science in recruitment ingezet om te bepalen welke kandidaten de grootste kans op succes hebben voor een openstaande functie. Lees hier meer over data science in HR en HR analytics.
- De belastingdienst past geautomatiseerde fraudedetectie toe. Zo kan op grote schaal misdaad tegen worden gegaan door data science modellen. Lees hier meer over data science binnen de overheid. Ook banken, credit card maatschappijen, en verzekeraars passen dergelijke modellen toe.
Kortom, je komt dagelijks al vele malen in aanraking met slimme data science algoritmes. En dat zal alleen maar meer worden.
Data science met Python
Python is een programmeertaal ontwikkeld door de Nederlander Guido van Rossem. Het is een gratis (open-source) taal die makkelijk te lezen en leren is. Python ontwikkelt zich de afgelopen jaren snel tot de belangrijkste taal voor data scientists. Onderstaande video geeft de opmars van Python mooi weer.
Grote organisaties als Uber, Netflix, en Google werken veelvuldig met Python en zijn voorlopers op het gebied van data science. Er is tevens een geweldige data science community binnen de Python community.
Wij zien het leren van Python daarom als de belangrijkste focus voor mensen die een data science carrière ambiëren.
NB: in enkele sectoren (b.v. wetenschap of bioinformatica) is programmeertaal R leidend. Lees voor meer info het blog over R vs Python.
Hoe ziet de toekomst voor data science er uit?
In de toekomst zullen bedrijven die slim om weten te gaan met data het grootste concurrentievoordeel hebben. We zien nu al dat data-intensieve organisaties als Google, Facebook, en Amazon ongelofelijk veel macht hebben door alle inzichten die zij uit hun eigen datasets kunnen halen.
Wij geloven dat het vergaren van relevante data en het transformeren van deze data tot waardevolle inzichten ook steeds belangrijker wordt voor kleine organisaties. Denk bijvoorbeeld aan het minen van social media data, of het scrapen van bepaalde webpagina's. Dit zijn simpele toepassingen waarmee een MKB'er zich kan onderscheiden.
Daarnaast is het belangrijk om aan te stippen dat de angst dat mensen helemaal uit organisaties verdwijnen ongegrond is. Algoritmes zullen steeds meer werk op een goede en betrouwbare manier over kunnen nemen, maar mensen blijven nodig om de prestaties van algoritmes in de gaten te houden en om de algoritmes te bedenken en ontwikkelen.
Hoe start ik met data science leren?
Ben je enthousiast om aan de slag te gaan met data science? Dan raden we je aan een kickstart te maken en jezelf een aantal dagen volledig onder te dompelen tijdens een van onze opleidingen. We bieden een Python cursus, een machine learning training, en een data science opleiding aan.
Als je een werkend bestaan hebt of een druk familieleven, dan werkt een klassikale training naar onze ervaring goed. Heb je meer vrije tijd omdat je momenteel bijvoorbeeld werkzoekend bent of nog studeert? Of ben je gewoon extreem gedisciplineerd? Dan kun je een online data science opleiding overwegen.
Download één van onze opleidingsbrochures voor meer informatie.
Download één van onze opleidingsbrochures voor meer informatie
Rik is data scientist en marketeer bij Data Science Partners. Vanuit zijn achtergrond op de Technische Universiteit Eindhoven heeft hij veel affiniteit met data. Na zijn studie heeft hij als consultant altijd met data gewerkt en tevens ervaring opgedaan in het geven van trainingen.