Data Science: wat is het en wat kun je ermee?


Het beroep ‘Data Scientist’ werd in 2012 in het Harvard Business Review uitgeroepen tot de meest sexy baan van de 21e eeuw. Termen als Big Data, Data Science en Data Analisten zijn tegenwoordig niet meer weg te denken uit het bedrijfsleven. Niet alleen de hype rondom Data Science is enorm, maar de vraag ook. Wat dit voor jou betekent en wat Data Science precies inhoudt, beschrijven we in deze blog.

 

Wat is Data Science?

Data Science is een interdisciplinair wetenschappelijk vak. Veel Data Analisten hebben een bèta opleiding gedaan in de richting van econometrie, wiskunde of informatica, gecombineerd met een master in Computer Science, Data Science of Artificial Intelligence.

Het doel van Data Science is het creëren van waarde uit data. Data Science bestaat uit een flink aantal stappen en is dan ook een grote investering voor bedrijven. Diverse methoden, processen en systemen kunnen ingezet worden om tot inzichten te komen die leiden tot belangrijke voorspellingen. Deze voorspellingen zijn voor bedrijven van belang om de juiste keuzes te kunnen maken. Zonder voorspellingen kan het lastig zijn om de beste optie te kiezen.

Kennis is macht en in deze context is kennis te vervangen door informatie. Hoe meer informatie je ter beschikking hebt, hoe beter je op de markt kunt inspelen. Door de inzet van Data Science kunnen bedrijven slimmer worden dan hun concurrenten, wat zorgt voor concurrentievoordeel. Ook kun je door middel van Data Science voorspellen waar de kansen van jouw bedrijf liggen. Beslissingen hoeven niet meer op gevoel genomen te worden, maar kunnen onderbouwd worden met betrouwbare gegevens.

 

De stappen binnen Data Science

Het proces van Data Science bestaat uit een cyclus van stappen. Op ieder moment van de dag wordt data gegenereerd en opgeslagen in databases. Voor het verkrijgen van de juiste voorspellingen moet je bepalen welke data je gaat gebruiken. Het herschikken, filteren en transformeren van data wordt gedaan door middel van programmeren. Met talen zoals Python en R wordt de data getransformeerd naar modellen die gebruikt kunnen worden bij het doen van voorspellingen. Nadat de data geprepareerd en getransformeerd is, kan de Data Analist aan de slag met statistiek. Door middel van het leggen van causale verbanden kan een Data Analist accurate voorspellingen doen.

Een veelgebruikte statistische methode om causale verbanden te meten is de regressie analyse.  Daarnaast kunnen ook voorspellingen gedaan worden met behulp van Machine Learning. Zoals de naam doet vermoeden is de kracht van Machine Learning het genereren van algoritmen die zelf lerend zijn. Tot slot wordt de data visueel in kaart gebracht. Dit is een belangrijke stap doordat verbanden soms pas zichtbaar zijn als deze visueel weergeven zijn. Na het visueel in kaart brengen van de gevonden verbanden zijn er vier opties die je kunt vinden:

  1. Je vindt niets
  2. Je vindt een verband dat niet bestaat
  3. Je vindt een verband waar geen rekening mee gehouden is
  4. Je vindt precies wat je had verwacht

In het eerste geval heb je geen verbanden gevonden, terwijl deze verbanden wel bestaan. Wanneer dit het geval is, dienen de stappen in het proces heroverwogen te worden en begint de cyclus weer van vooraf aan. De tweede optie is dat je een verband vindt dat er niet is. De analyses wijzen op een causaal verband, terwijl dit verband in werkelijkheid niet bestaat. Optie drie is dat je een verband vindt waar van te voren geen rekening mee is gehouden. Natuurlijk kunnen onverwachte resultaten interessant zijn, maar Data Science is voornamelijk gericht op het onderzoeken van een specifieke vraag vanuit de organisatie. De vierde en laatste optie is dat je precies het verband vindt wat je verwacht had. Het stappenplan is dan compleet en de resultaten worden doorgevoerd naar het management. Op basis van deze resultaten wordt de huidige strategie gevormd, vernieuwd of bewust hetzelfde gehouden.

 

Vacatures in Data Science

Ook binnen Java Professionals merken wij vanuit onze klanten een groei in de vraag naar Data Scientists. Data Scientists zijn enorm van toegevoegde waarde binnen een organisatie en dat verklaart ook de vraag vanuit de klant. Daarnaast groeit het aantal kandidaten die een opleiding in Data Science hebben gedaan en op zoek zijn naar een functie binnen deze branche. Om vraag en aanbod met elkaar in balans te brengen proberen wij zo goed mogelijk in te spelen op de groeiende vraag vanuit beide partijen.

Heb jij interesse, kennis of ervaring binnen de Data Science en wil je solliciteren op één van onze Data Science functies, klik dan hier voor het overzicht van vacatures.