Générez un processus de nettoyage de base pour les jeux de données numériques, y compris la gestion des valeurs manquantes et des valeurs aberrantes.
Tâche: Décrivez un processus étape par étape pour nettoyer un jeu de données numériques en vue d'une analyse préliminaire. Contexte: Vous disposez d'un jeu de données avec des caractéristiques numériques, et vous devez en assurer la qualité avant toute modélisation. Étapes à inclure: 1. Identifier les valeurs manquantes. 2. Suggérer des méthodes d'imputation de base pour les données numériques manquantes (ex: moyenne, médiane). 3. Identifier les valeurs aberrantes potentielles. 4. Suggérer des méthodes simples pour gérer les valeurs aberrantes (ex: plafonnement, suppression). Format de sortie: Fournissez une liste d'étapes concise et numérotée.
Définissez les règles d'intégrité de base pour un jeu de données donné et décrivez comment les valider.
Formuler des directives fondamentales pour une saisie de données cohérente et précise lors de la recherche sur le terrain, adaptées aux études de base.
Utilisez cette invite pour détecter et analyser les points de données anormaux dans les ensembles de données de séries temporelles, aidant à identifier les événements inhabituels ou les erreurs qui s'écartent significativement des modèles attendus.