Synopsis :
Cet ouvrage s’adresse à tous ceux qui cherchent à tirer parti de l’énorme potentiel des « technologies Big Data », qu’ils soient data scientists, DSI, chefs de projets ou spécialistes métier.
Le Big Data s’est imposé comme une innovation majeure pour toutes les entreprises qui cherchent à construire un avantage concurrentiel grâce à l’exploitation de leurs données clients, fournisseurs, produits, processus, machines, etc.
Mais quelle solution technique choisir ? Quelles compétences métier développer au sein de la DSI ?
Ce livre est un guide pour comprendre les enjeux d’un projet Big Data, en appréhender les concepts sous-jacents (en particulier le Machine Learning) et acquérir les compétences nécessaires à la mise en place d’un data lab.
Il combine la présentation :
• de notions théoriques (traitement statistique des données, calcul distribué...) ;
• des outils les plus répandus (écosystème Hadoop, Storm...) ;
• d’exemples d’applications ;
• d’une organisation typique d’un projet de data science.
Cette deuxième édition est complétée et enrichie par des mises à jour sur les réseaux de neurones et sur le Deep Learning ainsi que sur Spark.
À propos des auteurs:
Docteur en physique théorique reconverti dans l'IT depuis une quinzaine d'années il est aujourd'hui data scientist, directeur scientifique chez onepoint. Spécialiste du Machine Learning il s'intéresse actuellement au NLP (Natural Language Processing).
Cofondateur de Dataiku, plateforme de développement et d’exécution d’applications prédictives.
Cofondateur et CEO de Mapwize, une plateforme de cartographie indoor. Il est auteur de cinq ouvrages chez Dunod.
Directeur de projets stratégiques au sein de la DSI du groupe La Poste. Il contribue aux différentes déclinaisons SI de la stratégie Business du groupe.
Les informations fournies dans la section « A propos du livre » peuvent faire référence à une autre édition de ce titre.