data

Wat is en doet een data scientist?

Data science is een groot woord, maar het is gewoon een andere manier om te zeggen “echt goed in het verkrijgen van informatie uit gegevens”. Het omvat een reeks vaardigheden die je helpen de antwoorden te vinden die je zoekt in de grootste, meest ingewikkelde gegevensverzamelingen. Data scientists besteden hun tijd aan het bedenken van creatieve manieren om informatie te extraheren en te analyseren, en ze hebben een paar tools tot hun beschikking.

Dat gezegd hebbende, een academische achtergrond in wiskunde of computerwetenschappen is niet vereist om een data scientist te worden. Er zijn tal van cursussen beschikbaar online, via plaatselijke universiteiten of zelfs via je werkplek. Je leert hoe je grote datasets kunt manipuleren en interpreteren, bijvoorbeeld met beschrijvende statistieken zoals het gemiddelde, de mediaan en de modus, of met regressieanalyse om waarden te voorspellen op basis van eerdere waarden. Je leert ook hoe machinaal leren kan worden toegepast op jouw specifieke branche of bedrijf.

De wiskundige achtergrond

Hoewel het niet vereist is om in het veld te komen, zal een sterke wiskundige achtergrond je zeker een voordeel geven als het gaat om het vinden van werk als data scientist. Veel bedrijven gebruiken data science als onderdeel van hun verkoopteam of marketingproces, dus als je een achtergrond hebt in een van deze disciplines en de sprong wilt maken naar meer geavanceerde analytics, is het de moeite waard de tijd te nemen om je wiskunde bij te spijkeren.

Wat een data scientist nou eigenlijk doet

Een data scientist is iemand die veel verschillende rollen tegelijk kan spelen: statisticus, programmeur, bedrijfsanalist en machine learning expert. Ze zijn in staat om machine learning modellen te ontwikkelen en uit te voeren op grote datasets. Ze kunnen de resultaten van die modellen analyseren en voorstellen doen om ze te verbeteren. Ze kunnen misschien zelfs nieuwe tools of technieken ontwikkelen om rommelige gegevens te begrijpen, en ze zijn altijd op zoek naar nieuwe methoden om informatie te organiseren of visualisaties te maken die het voor mensen gemakkelijker maken om die informatie te begrijpen.

De beste manier om na te denken over wat een data scientist doet is als volgt: er is een ongelooflijk complex systeem dat tonnen rommelige gegevens genereert (dat kan van alles zijn, van medische dossiers tot weerpatronen). De datawetenschapper is de persoon die manieren vindt om al die rommel te begrijpen, zodat mensen op basis daarvan betere beslissingen kunnen nemen – of het nu over hun gezondheid gaat of over hoeveel regen we zullen krijgen. Ben jij geïnteresseerd? Je kunt op verschillende plekken een data scientist vacature vinden.

Externe serverdiensten, wat zijn de opties

Externe serverdiensten

Een server is een computer of een software-pakket dat een deel van een computer als het ware afzondert van de rest de computer. In het laatste geval praten we dus niet over een aparte computer, maar voor de gebruiker is het alsof dat wel zo is. Op een computer werden vroeger terminals aangesloten en al de gegevensverwerking vond plaats op de computer. Met andere woorden daarop werkten al de computerprogramma’s. Een PC zou kunnen worden gezien als een combinatie van een ouderwets computersysteem met een terminal in een apparaat. Computers worden echter niet meer op die manier gebruikt. De terminals hebben plaatsgemaakt voor PCs, die als intelligente werkstations, ook wel clients genoemd, dienst doen en waarop een deel van de gegevensverwerking plaatsvindt, en dus niet meer alleen op een centrale computer. Die computer wordt nu server genoemd en voert een aantal taken uit, waarvan diverse clients gebruik kunnen maken. Zoals een server voor de opslag van gegevens middels een database of voor gekanaliseerde toegang tot het internet. Een heel bekende externe serverdienst is een zogenoemde webhost, waarop je website en aanverwante zaken draaien. We hebben het in dit artikel over serverdiensten, die door een externe dienstverlener worden aangeboden en dus niet over eigen hardware in huis. Bij de dienstverlener wordt de server in een aangepaste ruimte geplaatst, waarin die optimaal functioneert. De netwerkaansluitingen zijn er. Er is apparatuur dat korte stroomonderbrekingen opvangt en bij langdurige storing de server op een nette manier uitzet. Een back-up-systeem voor gegevens is aanwezig. Enzovoort.

Keuzes

Wanneer je een externe serverdienst gebruikt, hoef je dus niet te investeren in de hardware daarvoor. Hoewel de kosten van die investering zijn te overzien, kan dat toch een voordeel zijn. Je kunt ook betrekkelijk eenvoudig van het type dienst veranderen. Klein beginnen en dan die mee laten groeien met je bedrijf. Het is dan dus wel zaak dat de dienstverlener een groeipad en voldoende flexibiliteit kan bieden. Aanbieders van serverdiensten bieden meestal de volgende basiskeuzes: dedicated server en virtual private server (VPS). Binnen die twee keuzes kan men vervolgens vaak kiezen tussen self-managed en managed.

Dedicated server

In het geval van een dedicated server, zou je kunnen zeggen dat jouw server fysiek bij de dienstverlener staat. Je bedrijf is de enige gebruiker ervan. De server is wel het eigendom van de dienstverlener. Je zou voor deze optie kunnen kiezen in plaats van een VPS, vanwege zorgen over de scheiding tussen virtual servers. Dat kan betrekking hebben op de veiligheid van de gegevens en/of onzekerheid over het feit dat het functioneren van andere virtual servers daadwerkelijk de eigen VPS inderdaad niet beïnvloeden.  Het kan natuurlijk ook simpel zo zijn, dat de gewenste verwerkingscapaciteit alleen op die manier door de leverancier kan worden geboden.

VPS

Een fysieke server kan worden opgedeeld in een aantal virtuele servers. Zoals al eerder genoemd, zal door het schaalvoordeel een VPS goedkoper zijn dan een dedicated server. Bij het goed functioneren van een VPS, merkt de gebruiker van een client het verschil niet. Daarom wordt de aanduiding ‘virtual private’ gebruikt. Uiteraard dient gewaarborgd te worden dat de virtuele servers software-matig daadwerkelijk goed zijn gescheiden. Het mag natuurlijk nooit gebeuren dat gegevens in de verkeerde handen terechtkomen. Het mag ook niet voorkomen dat een deel van de afgesproken verwerkingscapaciteit niet kan worden geleverd.  De lagere kosten van een VPS zullen vaak de reden zijn voor het kiezen van die optie.

Self-managed en managed

In het geval van een self-managed server, dedicated server of VPS maakt geen verschil, neem je het beheer in eigen handen. De dienstverlener zorgt in principe alleen voor de hardware en de besturings-software. Het enige verschil met een server zelf in huis hebben, is dat deze fysiek ergens anders staat. Je zult dus zelf alle kennis en de tijd moeten hebben om dat beheer te kunnen doen, zoals de installaties van nieuwe versies van je applicatie-software, en het configuratie- en het gebruikersbeheer. Je kunt die taken wel helemaal zelf plannen. Daarin heb je alle vrijheid. Je zult echter moeten zorgen voor de continuïteit van die kennis. Zeker bij een kleine onderneming kan dat een uitdaging zijn. Bij een managed server biedt de dienstverlener behalve de hardware en de besturings-software ook beheerdiensten. Doorgaans kan men kiezen uit diverse niveaus daarvan. Je kunt dus het niveau kiezen dat het beste bij je past. Als je geen ervaring hebt met het gebruik van servers/serverdiensten, kan je met een managed server het snelst operationeel zijn. Ook kan je dan je meer concentreren op je kernactiviteiten. Zeker bij een kleine onderneming kan dat laatste zwaar wegen.

Keuze dienstverlener

Voordat je op zoek gaat naar een externe dienstverlener, moet je voor jezelf helder hebben wat je behoeften/wensen zijn. Als je wilt overstappen van een in-huis server naar een dienstverlener, dan zal dat gemakkelijker zijn te bepalen. Maar ook als dat niet het geval is, is er op het web voldoende informatie beschikbaar om je daarbij te helpen. Het is sowieso altijd zinvol om je goed te oriënteren om wat er door diverse leveranciers zoal wordt geboden. Als je iemand kent die een externe serverdienst gebruikt, is het uiteraard een goed idee om daar eens mee te gaan praten. Geld speelt bij de keuze van een dienstverlener natuurlijk een belangrijke rol, maar ook onder meer diens reputatie, de garanties die worden geboden, de diversiteit aan opties voor een zo goed mogelijk afstemming op je behoeften, de groeimogelijkheden en de snelheid van reageren op je vragen en problemen.