Accueil>Tests>Questions>L'analyse en composantes principales vise à réduire le nombre de dimensions (ou de caractéristiques) dans un ensemble de données donné. L'objectif est de réduire ce nombre à une taille gérable, mais aussi de préserver l'intégrité de la structure du jeu de données, les tendances, les catégories (et ainsi de suite) sont conservées.
Question du test Machine learning - Les bases
L'analyse en composantes principales vise à réduire le nombre de dimensions (ou de caractéristiques) dans un ensemble de données donné. L'objectif est de réduire ce nombre à une taille gérable, mais aussi de préserver l'intégrité de la structure du jeu de données, les tendances, les catégories (et ainsi de suite) sont conservées.
Intermédiaire
La méthode “______” consiste en la réduction du nombre de dimensions d’un jeu de données. Le but est de réduire leur nombre à un niveau “gérable” ou “interprétable” tout en préservant l’intégrité du jeu de données : tendances, structures, catégories… Quel est le mot manquant?
Auteur: MartinStatut : PubliéeQuestion passée 67 fois
Modifier
0
Évaluations de la communautéPersonne n'a encore évalué cette question, soyez le premier !
Questions similairesPlus de questions sur Machine Learning
11
Comment gérer les données manquantes dans un jeu de données d'apprentissage donné ?7
Comment gérer les données manquantes dans un jeu de données d'apprentissage donné ?6
Le jeu de validation est utilisé pour fournir des évaluations fréquentes et non biaisées de l'ajustement du modèle sur le jeu d'entraînement tout en ajustant ses hyperparamètres/paramètres: en d'autres termes, le modèle est trouvé et ensuite testé sur le jeu de validation avant d'être amélioré une fois de plus.6
Quel est le mot manquant dans la phrase suivante : Overfitting est la production d'un modèle qui correspond trop étroitement à l'ensemble de données d'apprentissage et peut donc ne pas s'adapter à d'autres ensembles de données et donc ne pas effectuer de prévision fiable.4
Clustering est un processus d'apprentissage automatique non supervisé qui vise à découvrir automatiquement des regroupements naturels dans les données d'entrée. Lorsque cette méthode est utilisée, le développeur peut choisir le nombre de groupes qu'il souhaite créer.