Een fundamenteel promptpakket om je te helpen je gegevens op te schonen, te valideren en te transformeren voor robuuste machine learning en analytische workflows. Zorg vanaf het begin voor datakwaliteit.
Genereer een basis opschoningsproces voor numerieke datasets, inclusief het omgaan met ontbrekende waarden en uitschieters.
Leg gangbare technieken uit voor het transformeren van categorische kenmerken naar numerieke formaten voor machine learning.
Definieer basisregels voor gegevensintegriteit voor een gegeven dataset en schets hoe deze te valideren.