La collecte, l'analyse et l'extraction d'informations précieuses à partir d'une grande quantité de données nécessitent des outils informatiques et analytiques robustes et facilement accessibles. Data Mining and Business Analytics with R utilise le logiciel open source R pour l'analyse, l'exploration et la simplification de grands ensembles de données à haute dimension. En conséquence, les lecteurs reçoivent les conseils nécessaires pour modéliser et interpréter des données compliquées et devenir aptes à construire des modèles puissants pour la prédiction et la classification.
Mettant en évidence à la fois les concepts sous-jacents et les compétences informatiques pratiques, l'exploration de données et l'analyse commerciale avec R commence par la couverture de la régression linéaire standard et l'importance de la parcimonie dans la modélisation statistique. Le livre comprend des sujets importants tels que la sélection variable basée sur les pénalités (LASSO) ; la régression logistique ; les arbres de régression et de classification ; le regroupement ; les composants principaux et les moindres carrés partiels ; et l'analyse du texte et des données du réseau. En outre, le livre présente :
Une discussion approfondie et une démonstration approfondie de la théorie derrière les outils d'exploration de données les plus utiles
&; Illustrations de la façon d'utiliser les concepts décrits dans des situations réelles
&; Ensembles de données supplémentaires facilement disponibles et code R connexe permettant aux lecteurs d'appliquer leurs propres analyses aux documents discutés
De nombreux exercices pour aider les lecteurs à acquérir des compétences informatiques et à approfondir leur compréhension du matériau
Data Mining and Business Analytics with R est un excellent manuel de niveau supérieur pour les cours sur l'exploration de données et l'analyse commerciale. Le livre est également une référence précieuse pour les praticiens qui collectent et analysent des données dans les domaines de la finance, de la gestion des opérations, du marketing et des sciences de l'information.
Showcases R′s critical role in the world of business
Collecting, analyzing, and extracting valuable information from a large amount of data requires easily accessible robust computational and analytical tools. Data Mining and Business Analytics with R utilizes the open source software R for the analysis, exploration, and simplification of large high–dimensional data sets. As a result, readers are provided with the needed guidance to model and interpret complicated data and become adept at building powerful models for prediction and classification.
Highlighting both underlying concepts and practical computational skills, Data Mining and Business Analytics with R begins with coverage of standard linear regression and the importance of parsimony in statistical modeling. The book includes important topics such as penalty–based variable selection (LASSO); logistic regression; regression and classification trees; clustering; principal components and partial least squares; and the analysis of text and network data. In addition, the book presents:
- A thorough discussion and extensive demonstration of the theory behind the most useful data mining tools
- Illustrations of how to use the outlined concepts in real–world situations
- Readily available additional data sets and related R code allowing readers to apply their own analyses to the discussed materials
- Numerous exercises to help readers with computing skills and deepen their understanding of the material
Data Mining and Business Analytics with R is an excellent graduate–level textbook for courses on data mining and business analytics. The book is also a valuable reference for practitioners who collect and analyze data in the fields of finance, operations management, marketing, and the information sciences.