Effective Dimensionality Reduction in Pattern Recognition - Couverture souple

Patil Shobha; Pande Sanjay

 
9783659619557: Effective Dimensionality Reduction in Pattern Recognition

Synopsis

Les progrès dans la collecte de données et les capacités de stockage ont conduit à une surcharge d'informations dans la plupart des sciences. Ces ensembles de données présentent de nouveaux défis dans l'analyse des données. Les méthodes statistiques traditionnelles se décomposent en partie à cause de l'augmentation du nombre d'observations, mais surtout à cause de l'augmentation du nombre de variables associées à chaque observation. La dimension des données est le nombre de variables mesurées sur chaque observation. L'un des problèmes des ensembles de données de grande dimension est que, dans de nombreux cas, toutes les variables mesurées ne sont pas « importantes » pour comprendre les phénomènes d'intérêt sous-jacents. Il est toujours intéressant dans de nombreuses applications de réduire la dimension des données d'origine avant toute modélisation des données. Le PCA est un moyen d'identifier les modèles dans les données, et de réexprimer les données de manière à mettre en évidence leurs similitudes et différences. Étant donné que les modèles dans les données peuvent être difficiles à trouver dans les données de grande dimension, l'ACP est un outil puissant pour analyser les données. L'autre avantage principal du PCA est qu'une fois que vous avez trouvé ces modèles dans les données, vous pouvez compresser les données en réduisant le nombre de dimensions, sans trop de perte d'informations.

Les informations fournies dans la section « Synopsis » peuvent faire référence à une autre édition de ce titre.