Synopsis
Le Big Data s'est imposé comme une innovation majeure pour toutes les entreprises qui cherchent à construire un avantage concurrentiel grâce à l'exploitation de leurs données clients, fournisseurs, produits, processus, machines, etc. Ce livre est un guide pour comprendre les enjeux d'un projet Big Data, en appréhender les concepts sous-jacents (en particulier le machine learning) et acquérir les compétences nécessaires à la mise en place d'un data lab. Il combine la présentation de notions théoriques (traitement statistique des données, calcul distribué...), d'outils (écosystème Hadoop, Storm...) et d'exemples de machine learning ; Cette deuxième édition comporte des ajouts sur le deep learning et les réseaux de neurones, ainsi que des compléments et des mises à jour sur les moteurs de recommandations et Spark. Les compléments en ligne seront enrichis de nouveaux jeux de données pour un début de mise en pratique.
About the Author
Pirmin Lemberger est consultant senior et responsable de la veille technologique dans le groupe SQLI, ses tribunes paraissent dans 01Business, le JDN ainsi que sur le blog du groupe SQLI. Marc Batty est co-fondateur de Dataiku, éditeur de la solution "Data Science Studio", un environnement complet d'analyse et de développement d'applications prédictives. Médéric Morel est le fondateur et directeur général de Contexeo, éditeur de logiciel dans le domaine de la contextualisation. Il est l'auteur de 5 ouvrages chez Dunod. Jean-Luc Raffaëlli est directeur de projets stratégiques au sein de la DSI du Groupe La Poste. Il contribue aux différentes déclinaisons SI de la stratégie Business du groupe.
"About this title" may belong to another edition of this title.