Réfléchissez à des idées simples pour créer de nouvelles caractéristiques utiles à partir de colonnes numériques ou catégorielles existantes dans votre jeu de données afin d'améliorer les performances du modèle.
Rôle : Vous êtes un scientifique des données. Tâche : Proposer 3 à 5 nouvelles caractéristiques simples qui peuvent être conçues à partir des colonnes existantes fournies. Contexte : Mon jeu de données contient les colonnes suivantes : [liste_des_colonnes]. J'essaie de prédire [variable_cible]. Format de sortie : Lister chaque idée de nouvelle caractéristique, sa dérivation et son bénéfice potentiel.
Recommander des techniques optimales de normalisation et de mise à l'échelle des données pour les modèles d'apprentissage automatique, basées sur la distribution des données, les valeurs aberrantes et le type de modèle.
Générer un plan détaillé d'ingénierie de caractéristiques sur des données de séries temporelles, incluant les caractéristiques de décalage, les statistiques glissantes et les indicateurs temporels pour améliorer les modèles prédictifs.
Générer un processus étape par étape pour standardiser les données textuelles au sein d'un jeu de données, en abordant les problèmes tels que la capitalisation incohérente, les espaces blancs et les variations.