Réfléchissez à des idées simples pour créer de nouvelles caractéristiques utiles à partir de colonnes numériques ou catégorielles existantes dans votre jeu de données afin d'améliorer les performances du modèle.
Rôle : Vous êtes un scientifique des données. Tâche : Proposer 3 à 5 nouvelles caractéristiques simples qui peuvent être conçues à partir des colonnes existantes fournies. Contexte : Mon jeu de données contient les colonnes suivantes : [liste_des_colonnes]. J'essaie de prédire [variable_cible]. Format de sortie : Lister chaque idée de nouvelle caractéristique, sa dérivation et son bénéfice potentiel.
Générer un plan détaillé d'ingénierie de caractéristiques sur des données de séries temporelles, incluant les caractéristiques de décalage, les statistiques glissantes et les indicateurs temporels pour améliorer les modèles prédictifs.
Créez une stratégie sur mesure pour gérer les données manquantes, obtenez des recommandations sur les méthodes d'imputation basées sur les caractéristiques de votre jeu de données.
Générer un processus étape par étape pour standardiser les données textuelles au sein d'un jeu de données, en abordant les problèmes tels que la capitalisation incohérente, les espaces blancs et les variations.