Nederlands
DeutschDeutsch EnglishEnglish EspañolEspañol PortuguêsPortuguês

DeWolff Consulting

Projecten en cursussen in data science

Diensten

Data science projecten voor bedrijven, organisaties en MKB. Wij ontwikkelen toepassingen en modellen voor industieën, waarbij problemen adequaat worden opgelost met behulp van nieuwe technieken op het gebied van kunstmatige intelligentie en machine learning. Onze wetenschappelijke achtergrond stelt ons in staat de nieuwe gepubliceerde modellen te begrijpen en toe te passen.

Modellen en toepassingen

Onze specialisatie is het creëren van oplossingen voor klanten die belangrijke informatie uit hun processen willen halen. Dat wil zeggen, door middel van de enorme hoeveelheid gegevens die in databases beschikbaar zijn, kunnen we conclusies trekken, gebeurtenissen voorspellen, informatie samenvatten, ontbrekende gegevens aanvullen, trends vinden, enz. om zo intelligente beslissingen te nemen en tijd te besparen.

We gebruiken verscheidene doeleinden (regressie, classificatie, clustering en meer) en modellen (neurale netwerken, Gaussische processen, auto encoders en meer) om bijvoorbeeld de volgende vragen te kunnen beantwoorden:

  • Wanneer valt een server om en hoe kan dat worden voorkomen?
  • Hoe kunnen risico's worden geminimaliseerd bij het lenen aan klanten?
  • Waar is de kans het grootst om bepaalde mineralen in de grond te vinden?
  • Welk gebied is vitaal om bosbranden en ontbossingen te voorkomen?
  • Hoe kan de productie van voedsel worden geoptimaliseerd met betrekking tot klimaatverandering?

Cursussen

Wij bieden inleidende cursussen aan op het gebied van data science en machine learning om teams te trainen in de concepten die samenhangen met kunstmatige intelligentie. Kennis van KI helpt om te begrijpen hoe modellen werken en hoe gegevens een belangrijke rol spelen.

Gedurende de cursus worden verschillende onderwerpen uitgelegd, zoals de grondbeginselen van machine learning, hoe belangrijke algoritmen werken, wat bedoeld wordt met gegevens van hoge kwaliteit, hoe gegevens bijdragen aan het trainen van een model en de workflow voor het trainen en gebruiken van modellen. Daarnaast behandelen we de basisprincipes van Python, wetenschappelijke software pakketten en fundamentele statistiek.

Team

  • Taco de Wolff
  • Data scientist
  • Master in Natuurkunde (Rijksuniversiteit Groningen)
  • Onderzoeker (CMM, Universiteit van Chili)
  • Alejandro Cuevas
  • Data scientist
  • Master in Tech. Wiskunde (Universiteit van Chili)
  • Machine Learning ingenieur (NoiseGrasp)

Projecten

VZOR Brain

Failure prediction m.b.v. alerts en logs op servers. Aan de hand van waarschuwingen van CPU gebruik, geheugen, connecties, enz. van overbelasting of problemen, leert een classificatie model of het systeem binnenkort zal uitvallen en welke componenten daarvan de oorzaak zijn. Wij gebruiken XGBoost als classificatie model, in combinatie met LDA om onderwerpen uit de waarschuwingsberichten te halen, SMOTE om de gegevens in evenwicht te brengen, en LIME om de resultaten interpreteerbaar te maken.

Multi-output Gaussian process toolkit

Ontwikkeling van een toolkit in Python en PyTorch voor regressie en classificatie doeleinden met behulp van multi-output Gaussische processen. De toolkit implementeert alles vanaf het laden en manipuleren van gegevens, hyperparameter initialisatie en training, tot modelvisualisatie en interpretatie. Het bevat een grote verscheidenheid aan implementaties van modellen, waarschijnlijkheidsverdelingen en kernels, en maakt gebruik van GPU-training mogelijk.

GitHub archief: https://github.com/GAMES-UChile/mogptk

BancoEstado cursus

BancoEstadoIn samenwerking met het Center of Mathematical Modeling van de Universiteit van Chili hebben wij een cursus machine learning ontworpen voor een van de grootste banken in Chili, met onder andere: een inleiding tot kunstmatige intelligentie, basisgebruik van wetenschappelijk Python (NumPy, SciPy, Pandas, scikit-learn, PyTorch), regressie, classificatie, optimalisatie, clustering, support vector machines, K-nearest neighbours, kruisvalidatie, neurale netwerken, random forests, XGBoost, Bayesiaanse netwerken en grafieken. De cursus werd afgesloten met de implementatie van een kosten-verkoopmodel op basis van reële kredietbankgegevens van de bank.

Contact