Gestructureerde data

Wat zijn gestructureerde data?

Big Data bestaan voor 80% uit ongestructureerde data (bijv. pdf-files, gps-data, mobiele data) en 20% gestructureerde data (bijv. CRM-data). Ondanks dat het aandeel van structured data relatief klein is, moet je hun waarde niet onderschatten.

Gestructureerde data zijn te vinden in een vastgesteld veld binnen een record of bestand. Ze kunnen eenvoudig georganiseerd, geanalyseerd, ingevoerd en opgevraagd worden. Gestructureerde data worden meestal gemanaged met programmeertaal SQL. Dit is een programmeertaal die ontworpen is om data te managen en op te vragen in relationele database managementsystemen.

Structured data: machine generated

Gestructureerde data kunnen zowel door machines als mensen gegenereerd worden. Als structured data door machines gegenereerd (machine generated) zijn, wil dat zeggen dat er data gegenereerd worden zonder dat daarbij mensen aan te pas komen. Voorbeelden van machine gegenereerde data zijn sensordata (GPS), weblogdata afkomstig uit onder andere servers en applicaties en call detail record, zoals het nummer dat belt, duur van het telefoongesprek en informatie van beller en ontvanger.

Gestructureerde data: human generated

Wanneer data door mensen gegenereerd (human generated) worden, wil dat zeggen dat er sprake is van een interactie tussen machine en mensen. Voorbeelden van door mensen gegeneerde gestructureerde data zijn gegevens die mensen invoeren via de pc, zoals naam, leeftijd, en enquêteantwoorden. Met deze data krijg je inzicht in wie je klanten zijn. Bovendien is het nuttig om de basis van consumentengedrag te begrijpen. Een andere bron van data is click-stream data. De clicks die je op een website doet worden bijgehouden en geven onder andere inzicht in consumentengedrag en kooppatronen.

Zoals je ziet, bevatten ook gestructureerde data waardevolle informatie, ondanks dat ze maar zo’n klein deel van Big Data beslaan. Je zou kunnen zeggen dat het zonder gestructureerde data lastig is om erachter te komen waar je kennis en inzichten vandaan moet halen die verscholen liggen in de ongestructureerde data. Kortom, gestructureerde data maken het Big Data plaatje compleet.

Meer weten over gestructureerde data?

Als je meer wilt weten over het omgaan met gestructureerde data volg dan de cursus Data Analyse bij de Big Data Academy. Dit is de plek waar je opgeleid wordt tot Big Data specialist. De cursus Data Analyse is het startpunt voor jouw carrière als Big Data specialist. Deze cursus leidt je op voor het Big Data Foundation certificaat. Met dit Big Data certificaat toon je aan dat je inhoudelijk en praktische basiskennis over Big Data bezit.