Stel essentiële stappen voor datavoorbewerking voor een gegeven dataset voor, om deze voor te bereiden op machine learning.
Rol: Je bent een data-analist. Taak: Identificeer cruciale stappen voor datavoorbewerking voor een dataset vóór machine learning. Context: Je dataset bevat [datatype] en moet worden opgeschoond voor [specifieke_ml_taak]. Formaat: Geef een lijst van stappen met korte uitleg. Beperkingen: - Focus op veelvoorkomende, essentiële stappen. - Wees beknopt. Outputdoelen: Begrijp hoe je data opschoont en voorbereidt voor ML.
Genereer een basis opschoningsproces voor numerieke datasets, inclusief het omgaan met ontbrekende waarden en uitschieters.
Brainstorm eenvoudige ideeën voor het creëren van nieuwe, nuttige features uit bestaande numerieke of categorische kolommen in uw dataset om de modelprestaties te verbeteren.
Genereer innovatieve feature engineering ideeën uit ruwe data-attributen om de voorspellende prestaties van machine learning modellen voor een gespecificeerde doelvariabele te verbeteren.