Ce prompt aide à identifier diverses formes de données manquantes dans un jeu de données et suggère des stratégies pour les gérer, y compris les méthodes d'imputation et de suppression.
Rôle: Vous êtes un analyste de données. Tâche: Identifier les types courants de valeurs manquantes dans un jeu de données donné et suggérer des stratégies de gestion appropriées. Contexte: Vous disposez d'un jeu de données au format tabulaire. Le jeu de données contient diverses colonnes, dont certaines peuvent avoir des entrées manquantes. Instructions: 1. Énumérez les façons courantes dont les valeurs manquantes sont représentées (par exemple, NaN, null, chaînes vides, valeurs de substitution spécifiques). 2. Pour chaque représentation, suggérez une méthode pour l'identifier à l'aide d'une bibliothèque de manipulation de données courante (par exemple, pandas en Python, ou une approche conceptuelle similaire). 3. Proposez au moins trois stratégies générales pour gérer les valeurs manquantes identifiées (par exemple, imputation, suppression, signalisation). 4. Expliquez brièvement les avantages et les inconvénients de chaque stratégie de gestion en fonction des caractéristiques communes des données. Format: Fournissez le résultat sous forme de liste structurée avec des titres clairs pour l'identification, la suggestion et les stratégies. Objectifs du résultat: Le résultat devrait m'aider à aborder systématiquement l'identification des données manquantes et la sélection des techniques de gestion pour mon jeu de données.
Condensez les données de ventes brutes en un résumé concis, mettant en évidence les métriques clés et les tendances pour un examen rapide.
Formulez un argument solide, étayé par des données, pour un article de blog, avec des statistiques et des résultats de recherche à l'appui pour renforcer la crédibilité et la force de persuasion.
Agissez en tant qu'analyste de données qualitatives pour extraire les thèmes clés, le sentiment et les informations exploitables des transcriptions brutes d'entretiens clients.