Big Data en Data Mining

Auteur:

Auteur: Dilek Türkyilmaz
Gepubliceerd op: 02-03-2015

Data mining definitie

Tegenwoordig wordt big data steeds een belangrijkere term, daarbij is het gebruik van data mining van essentieel belang. Maar wat is data mining? Data mining is het proces van zoeken naar betekenisvolle patronen en correlaties in datasets waarbij gebruik wordt gemaakt van onder andere: data analyse, machine learning en statistieken. Je verzamelt dus belangrijke informatie uit diverse datasets en zorgt er voor dat er duidelijke uitkomsten uit voort komen. Een data analyse heeft nut als er voldoende data beschikbaar is en je met datamining waarde toevoegt aan het bedrijf. Dit kan bijvoorbeeld relevante en nieuwe strategische informatie zijn voor de marketing.
In het bedrijfsleven wordt data mining vaak gebruikt om de historische bedrijfsactiviteiten te analyseren. Al deze data zijn opgeslagen in data warehouse databases. Data mining software maakt gebruik van geavanceerde algoritmen door te zoeken in de grote hoeveelheden data. Dit kan bedrijven helpen bij het ontdekken van nieuwe strategische bedrijfsinformatie. Op deze manier lever je dankzij datamining analyses, ook een bijdrage aan de business intelligence. Tijdens een cursus datamining ga je zelf aan de slag met diverse datasets en algoritmen.

Datamining tutorial


In deze data mining tutorial legt Arjan Burger jou uit waar datamining voor staat en wat je er mee kunt doen binnen jouw bedrijf. Zo kan je gebruik maken van beslissingsbomen, neurale netwerken en rule induction om nuttige statistische verbanden te leggen en op basis daarvan weer voorspellingen te doen.

Data mining specialist

Aan de hand van algoritmen die je bedenkt en de machine learning (het automatisch uitvoeren van de algoritmen) kan je datasets analyseren. Eén van de data mining tools die je hiervoor kunt gebruiken is Weka. Dat is een machine learning algoritme programma die taken uitvoert. Tijdens een opleiding datamining zul je dan ook aan de slag gaan met diverse data mining software en algoritmen. Hierbij kan je gebruik maken van een beslissingsboom, zodat je een opzet hebt voor de predictive analytics.
Als data mining specialist is het handig om goed om te gaan met de diverse algoritmen. Wanneer je werkt met een algoritme ben je eigenlijk een stap voor stap methode/berekening aan het volgen om een bepaald doel te bereiken. Hier vind je een overzicht van de diverse algoritmen.

  • Clustering/segmentatie: In de bestaande data worden diverse groepen en structuren/patronen gedetecteerd die ‘gelijk’ zijn of gelijke eigenschappen bevatten. Zo kan je diverse segmenten maken binnen een doelgroep.
  • Classificatie: Wanneer nieuwe data binnenkomt, wordt dat automatisch op de juiste plek in het structuur van de dataset opgenomen.
  • Regressie: Het vinden van verbanden tussen een afhankelijke variabele en één of meer onafhankelijke variabelen. Het wordt vooral gebruikt voor om voorspellingen te maken en vaak in combinatie met machine learning.
  • Associatie: Associatie is het vinden van een relatie tussen twee variabelen. Dit wordt ook vaak aangeduid als het winkelmandje analyse, waarbij het systeem automatisch aangeeft wat andere klanten ook bij dit product hebben gekocht.
  • Afwijkingendetectie: Het identificeren van ongewone gegevens in de dataset. Deze gegevens passen dus niet in een bepaald patroon en zullen dus nader bekeken moeten worden.
  • Samenvatting: Een beknopte weergave van een dataset, waar vaak ook een datavisualisatie bij hoort. Dit doet bijvoorbeeld Google ook om websites te indexeren voor zoekmachines.

Training data mining

Wil je meer leren over het toepassen van datamining? Schrijf je dan in voor een training Data Mining. Tijdens een cursus data mining ga je aan de slag met pre-processing en diverse algoritmen, zoals classificatie, regressie, clustering, associatie en visualisatie van de analyseresultaten. Met de resultaten van deze diverse data analyses, maak je voorspellingen en kan je beslissingen nemen voor het verdere bedrijfsproces.

Terug