Machine Learning

3 livres et 5 critiques, dernière mise à jour le 28 novembre 2019 , note moyenne : 4.7

  1. Intelligence artificielle vulgarisée - Le Machine Learning et le Deep Learning par la pratique
  2. Big Data et Machine Learning - Manuel du data scientist
  3. Python pour le data scientist - Des bases du langage au machine learning
couverture du livre Intelligence artificielle vulgarisée - Le Machine Learning et le Deep Learning par la pratique

Note 5 drapeau
Détails du livre
Sommaire
Critiques (1)
1 commentaire
 
 

Intelligence artificielle vulgarisée - Le Machine Learning et le Deep Learning par la pratique

de
Public visé : Intermédiaire

Résumé de l'éditeur

L'intelligence artificielle est aujourd'hui incontournable. Ce livre a pour objectif de présenter de façon vulgarisée les concepts du Machine Learning et du Deep Learning pour les mettre en application dans des projets basés sur de l'intelligence artificielle, en mettant de côté autant que possible les formules mathématiques et statistiques. Il s'adresse avant tout aux développeurs mais intéressera également toute personne novice en la matière.

Avec une démarche progressive, chaque notion étudiée dans ce livre est illustrée par des cas pratiques écrits en langage Python. Des connaissances dans ce langage sont ainsi un plus.

Après une introduction à l'intelligence artificielle et l'identification des craintes qu'elle suscite, l'auteur propose quelques rappels sur les fondamentaux du langage Python ainsi qu'une révision de certaines notions statistiques pour appréhender au mieux les algorithmes du Machine Learning. Le lecteur peut ensuite mettre en pratique certains de ces algorithmes et découvrir comment donner la faculté à sa machine de prédire des valeurs et de réaliser des classifications.

Vient ensuite l'étude de l'apprentissage non supervisé et de l'usage des réseaux de neurones qui permet de surcroît au lecteur de découvrir comment les neurosciences ont eu un impact sur l'intelligence artificielle. Le livre se termine avec la réalisation de cas pratiques : un premier mêlant réseau de neurones et parole et un second relatif au premier chatbot.

Des éléments complémentaires sont en téléchargement sur le site www.editions-eni.fr.

Édition : ENI - 434 pages , 1re édition, 5 septembre 2019

ISBN10 : 2409020739 - ISBN13 : 9782409020735

Commandez sur www.amazon.fr :

29.90 € TTC (prix éditeur 29.90 € TTC)
Avant-propos
Vous avez dit intelligence artificielle ?
Les fondamentaux du langage Python
Des statistiques pour comprendre les données
Principaux algorithmes du Machine Learning
Machine Learning et Pokémons : première partie
Machine Learning et Pokémons : seconde partie
Bien classifier n'est pas une option
Opinions et classification de textes
Abricots, cerises et clustering
Un neurone pour prédire
Utilisation de plusieurs couches de neurones
La classification d'images
Votre ordinateur sait lire !
Hommage au premier ChatBot
Critique du livre par la rédaction Martin le 28 novembre 2019
Avec cet excellent livre, le domaine d’application auquel ce livre fait référence, « l’intelligence artificielle » (notez les guillemets c’est important) est un domaine qui n’est pas si récent théoriquement parlant mais un domaine qui a connu une renaissance assez spectaculaire depuis le début des années 2000 au gré des progrès informatiques.
Ce livre vous emmène de manière très instructive de la genèse du concept d’ « IA » aux usages modernes et à leurs applications pratiques. Après une brève introduction à Python (le minimum vital pour arriver à faire quelques tests grandeur nature), un survol des concepts mathématiques sous-jacents qui structurent les algorithmes d’apprentissage profond, vous plongez directement la tête dans des exemples concrets utilisant les bibliothèques actuelles disponibles dans le monde Python.

L’auteur accomplit un vrai tour de force : aborder les concepts abstraits tout en faisant bien attention à ne pas perdre le lecteur en route (n’oublions pas que le but de ce livre c’est du vulgariser un domaine qui nécessite des compétences en mathématiques très pointues). Cela offre la possibilité d’aller se documenter à côté pour les fondus des maths. Un florilège de mots doux : régression linéaire univariée, linéaire multiple, polynômiale, apprentissage supervisé, non supervisé, arbre de décision, agrégation de modèles, mélange Gaussien, réseaux neuronaux ou le DBSCAN pour Density Based Spatial Clustering of Application With Noise.

Une fois ces chapitres passés, on bascule dans les cas pratiques expliqués patiemment et totalement réalisables pas à pas sur son ordinateur. Vous allez apprendre à classer, prédire et ranger les informations. Les bibliothèques dans ce domaine étant open-source, Aurélien VANNIEUWENHUYZE, montre et explique comment les installer et les utiliser à bon escient. C’est le principe de la boîte noire. Vous utilisez sans décortiquer, bien que dans certains cas, les variantes dans la manière de faire l’apprentissage profond et les différences dans les résultats sont clairement abordées. La partie la plus technique est celle qui montre l’utilisation de l’outil open-source de Google : TensorFlow. Vous touchez du doigt l’étendue des possibles…

Cerise sur le gâteau, tous les fichiers utilisés dans les démonstrations sont disponibles sur le site de l’éditeur.

Avec ce livre, vous apprendrez que sans entraînement, l’intelligence artificielle n’est rien. Et que comme pour toute chose, l’apprentissage conditionne une bonne partie des résultats. C’est clairement un livre à posséder tant il met à portée de main un domaine d’activité abstrait, ardu et incontournable. Bref, à garder dans sa bibliothèque.




 Poster une réponse Signaler un problème

Avatar de Malick Malick - Community Manager https://www.developpez.com
le 28/11/2019 à 12:31
Bonjour chers membres du club,

Je vous invite à lire la critique de rawsrc au sujet du livre :



Avec cet excellent livre, le domaine d’application auquel ce livre fait référence, « l’intelligence artificielle » (notez les guillemets c’est important) est un domaine qui n’est pas si récent théoriquement parlant mais un domaine qui a connu une renaissance assez spectaculaire depuis le début des années 2000 au gré des progrès informatiques. Lire la suite de la critique...
Bonne lecture .
Avatar de rawsrc rawsrc - Modérateur https://www.developpez.com
le 22/11/2019 à 17:33
Intelligence artificielle vulgarisée - Le Machine Learning et le Deep Learning par la pratique
L'intelligence artificielle est aujourd'hui incontournable. Ce livre a pour objectif de présenter de façon vulgarisée les concepts du Machine Learning et du Deep Learning pour les mettre en application dans des projets basés sur de l'intelligence artificielle, en mettant de côté autant que possible les formules mathématiques et statistiques. Il s'adresse avant tout aux développeurs mais intéressera également toute personne novice en la matière.

Avec une démarche progressive, chaque notion étudiée dans ce livre est illustrée par des cas pratiques écrits en langage Python. Des connaissances dans ce langage sont ainsi un plus.

Après une introduction à l'intelligence artificielle et l'identification des craintes qu'elle suscite, l'auteur propose quelques rappels sur les fondamentaux du langage Python ainsi qu'une révision de certaines notions statistiques pour appréhender au mieux les algorithmes du Machine Learning. Le lecteur peut ensuite mettre en pratique certains de ces algorithmes et découvrir comment donner la faculté à sa machine de prédire des valeurs et de réaliser des classifications.

Vient ensuite l'étude de l'apprentissage non supervisé et de l'usage des réseaux de neurones qui permet de surcroît au lecteur de découvrir comment les neurosciences ont eu un impact sur l'intelligence artificielle. Le livre se termine avec la réalisation de cas pratiques : un premier mêlant réseau de neurones et parole et un second relatif au premier chatbot.

Des éléments complémentaires sont en téléchargement sur le site www.editions-eni.fr.

[Lire la suite]




 
couverture du livre Big Data et Machine Learning

Note 4.5 drapeau
Détails du livre
Sommaire
Critiques (3)
1 commentaire
 
 

Big Data et Machine Learning

Manuel du data scientist

de
Public visé : Intermédiaire

Résumé de l'éditeur

Cet ouvrage s’adresse à tous ceux qui réfléchissent à la meilleure utilisation possible des données au sein de l’entreprise, qu’ils soient data scientists, DSI, chefs de projets ou spécialistes métier.
Le Big Data s’est imposé comme une innovation majeure pour toutes les entreprises qui cherchent à construire un avantage concurrentiel grâce à l’exploitation de leurs données clients, fournisseurs, produits, processus, machines, etc.
Mais quelle solution technique choisir ? Quelles compétences métier développer au sein de la DSI ?
Ce livre est un guide pour comprendre les enjeux d’un projet Big Data, en appréhender les concepts sous-jacents (en particulier le machine learning) et acquérir les compétences nécessaires à la mise en place d’un data lab.
Il combine la présentation :
  • de notions théoriques (traitement statistique des données, calcul distribué...) ;
  • d’outils (écosystème Hadoop, Storm...) ;
  • d’exemples de machine learning ;
  • d’une organisation typique d’un projet de data science.

Édition : Dunod - 240 pages , 1re édition, 18 février 2015

ISBN10 : 2100720740 - ISBN13 : 9782100720743

Commandez sur www.amazon.fr :

29.90 € TTC (prix éditeur 29.90 € TTC)
Sommaire Les fondements du Big Data.
  • Les origines du Big Data.
    • Le Big Data dans les organisations.
    • Le mouvement NoSQL.
    • L’algorithme MapReduce et le framework Hadoop.
  • Le métier de data scientist.
    • Le quotidien du data scientist.
    • Exploration et préparation de données.
    • Le machine learning.
    • La visualisation des données.
  • Les outils du Big Data.
    • L’écosystème Hadoop.
    • Analyse de logs avec Pig et Hive.
    • Les architectures λ.
    • Apache Storm.

Critique du livre par la rédaction Mickael BARON le 31 mars 2015
La couverture du livre donne le ton, c'est un ouvrage qui s'adresse aux personnes intéressées par le métier de « Data Scientist », le buzz word du moment. L'ouvrage se décompose en trois grandes parties. La première discute du Big Data, de ses origines, comment il est intégré dans les entreprises et des nouveaux outils pour le stockage (NoSQL) et le traitement (MapReduce). Dans une deuxième partie, les auteurs s'intéressent principalement au cycle de vie de la donnée et présentent essentiellement de nombreux algorithmes de machine Learning. Enfin une dernière partie se focalise sur les outils pour faire du Big Data. De manière générale, cet ouvrage est très agréable à lire. Il propose de nombreux retours d'expérience et d'exemples simples qui illustrent la présentation des algorithmes de machine Learning.

Cet ouvrage n'est pas du tout technique, vous ne trouverez pas de code Java sur comment développer un algorithme MapReduce. Il ne demande pas de connaissance approfondie. Il s'agit d'un livre qui présente les concepts autour du machine Learning et donne un horizon de l'écosystème existant concernant les outils dédiés. De mon point de vue, ce livre a su compléter mes connaissances en termes d'usage des technologies BigData. En effet, je me suis intéressé au monde du Big Data en commençant par la technique via Hadoop et certains NoSQL. Toutefois, il m'était toujours difficile de savoir à quel moment exploiter ces technologies, les cas réels. Il est difficile de s'y émerger quand on ne travaille pas explicitement dessus. Ce livre apporte des débuts de réponse. J'apprécie aussi l'honnêteté des auteurs qui mettent en garde les lecteurs : tout problème ne se résout pas forcément par un problème Big Data !

Concernant les quelques points négatifs, j'en ai relevé quelques-uns qui sont globalement très légers.
  • Le premier concerne la troisième partie qui se focalise sur les outils pour faire du Big Data. Je trouve qu'un grand nombre de chapitres de cette dernière partie auraient pu être mis en première partie et consacrer une partie exclusive aux études de cas. Certes, il y a un chapitre sur l'utilisation de Hive et Pig pour le traitement de logs, mais un chapitre spécifique avec plusieurs études de cas aurait pu être intéressant. J'ai eu quelque mal à trouver comment appliquer les algorithmes de machine Learning sur le modèle de programmation MapReduce.
  • Le deuxième concerne l'utilisation exclusive MapReduce comme unique modèle de programmation. Certes les auteurs citent clairement qu'il y a un nouveau besoin de modèle de programmation temps réel, que le modèle de programmation de Spark est plus efficace face à MapReduce, mais tout au long de la lecture, on peut penser qu'il n'y a que celui-ci. J'ai hésité à donner ce point négatif, mais le livre est quand même récent, il date de 2015.

En conclusion, il s'agit d'un très bon livre, qui structure le cycle de vie de la donnée et donne des informations pertinentes.
Critique du livre par la rédaction Nassima BENAMMAR le 31 mars 2015
Ce livre expose des notions de base sur big data, comme l'indique son titre, et du data science. Il se compose de trois parties.

La première et la troisième partie portent principalement sur le big data et les technologies nouvelles dans ce domaine telles que l'algorithme Map Reduce, l'architecture Lambda et la plateforme Hadoop.

La deuxième partie porte sur le data science et principalement sur l'application du machine learning en citant ses différents algorithmes et en exposant les démarches d'un data scientist dans la conception de sa solution.

Le livre présente des explications simples de multiples notions liées au big data et au data science, grâce à des illustratifs faciles à comprendre, notamment dans la deuxième partie où il expose quelques exemples concrets sur l'impact du data science sur le succès des entreprises ainsi que sur l'interprétation des données dans des cas réels.

Ce qui doit être pris en considération (et qui est d'ailleurs mentionné au début du livre) est le fait que ces trois parties sont indépendantes et peuvent être lues séparément, autrement le lecteur risque de se perdre, car il n'y a pas d’enchaînement logique entre ces trois parties.

Enfin, ce livre est un bon manuel pour les professionnels de l'informatique décisionnelle qui veulent mieux exploiter leurs données et aussi pour les développeurs et architectes qui souhaitent connaitre des généralités sur le big data et le data science.
Critique du livre par la rédaction Lucas Girardin le 15 janvier 2016
Big Data et Data Scientist deux mots (quatre en réalité mais qui ne marche que par deux) que l'on entend et trouve un peu partout. Cependant dur de réussir à comprendre ce qui se cache derrière. Qu'est-ce qui fait qu'un gisement de donnée est appelé Big Data alors que d'autre non ? Quel est le véritable boulot d'un Data Scientist et comment le devient-on ? Comment différencier le baratin commercial de la réalité du terrain ? Voila déjà a quoi sert ce livre et rien que pour ça il mérite d'être lu. Mais il va encore plus loin en expliquant quel outil existe pour faire du big data et les différents algorithmes. Sans connaissance mathématique et notamment en statistique ces passages sont assez durs à lire et à comprendre mais il reste nécessaire de connaitre leurs utilités et leurs cas d’utilisations.

Ce livre explique aussi ce qu'est le célèbre algorithme MapReduce. A quoi il sert et les problématique qu'il résout. Hadoop est aussi passer à la moulinette pour comprendre son principe, des rappels sur le NoSQL sont abordés sans trop rentrer dans le détail toute fois. Avec ce livre on fait un grand bon dans la compréhension de l'informatique aujourd'hui. Pour quiconque qui s’intéresse au différent mouvement de nos jours, c'est le livre à lire. Mieux même, toute personne souhaitant aborder le big data pour la première fois, c'est aussi le meilleurs point de départ que l'on puisse conseiller. En plus des étudiants en informatique, des DSI, des développeurs et de toute personne qui est informaticiens à qui on conseille de lire des livres en général, celui-ci je le conseillerai aussi au métier car en plus de peaufiner leur culture sur le Big Data ils se doivent de connaitre le métier de Data Scientist qui a mon sens représente une véritable évolution dans la relation Métier-DSI.

Avec ce livre j’ai pu participer à des conférences et des présentations d’outils de Big Data comme Zepelin ou Spark et comprendre ce qui m’était raconté. Je ne regrette définitivement pas la lecture de ce livre.




 Poster une réponse Signaler un problème

Avatar de Lana.Bauer Lana.Bauer - Expert éminent sénior https://www.developpez.com
le 31/03/2015 à 23:51
Bonjour,

La rédaction Developpez a lu pour vous :

Cet ouvrage s’adresse à tous ceux qui réfléchissent à la meilleure utilisation possible des données au sein de l’entreprise, qu’ils soient data scientists, DSI, chefs de projets ou spécialistes métier.
Le Big Data s’est imposé comme une innovation majeure pour toutes les entreprises qui cherchent à construire un avantage concurrentiel grâce à l’exploitation de leurs données clients, fournisseurs, produits, processus, machines, etc.
Mais quelle solution technique choisir ? Quelles compétences métier développer au sein de la DSI ?
Ce livre est un guide pour comprendre les enjeux d’un projet Big Data, en appréhender les concepts sous-jacents (en particulier le machine learning) et acquérir les compétences nécessaires à la mise en place d’un data lab.
Il combine la présentation :

  • de notions théoriques (traitement statistique des données, calcul distribué...) ;
  • d’outils (écosystème Hadoop, Storm...) ;
  • d’exemples de machine learning ;
  • d’une organisation typique d’un projet de data science.


Avatar de bous.jo bous.jo - Candidat au Club https://www.developpez.com
le 09/03/2018 à 14:58
est ce que vous pourrez lz m'envoyer s'il vous plait

 
couverture du livre Python pour le data scientist

Note 5 drapeau
Détails du livre
Sommaire
Critiques (1)
0 commentaire
 
 

Python pour le data scientist

Des bases du langage au machine learning

de
Public visé : Intermédiaire

Résumé de l'éditeur

Python est devenu en quelques années un langage majeur dans l'univers des applications centrées sur le traitement des données, et plus particulièrement des gros volumes de données (big data).
Cet ouvrage servira de guide à tous ceux qui s'intéressent à l'utilisation de Python pour le travail sur les données et l'automatisation de certaines tâches (data science). Il met l'accent sur la préparation et la mise en forme des données qui sont essentielles dans la qualité du résultat et qui constituent aujourd'hui une part importante du travail du data scientist.

L'ensemble des exemples et des exercices présentés dans cet ouvrage sont disponibles sous forme de Notebooks Jupyter. Ils sont accessibles directement sur GitHub dans le répertoire dédié à l'ouvrage ou en téléchargement sur le site Dunod.

Édition : Dunod - 304 pages , 24 octobre 2018

ISBN10 : 2100770756 - ISBN13 : 9782100770755

17,5 x 2 x 25 cm

Commandez sur www.amazon.fr :

29.90 € TTC (prix éditeur 29.90 € TTC)
L'origine et l'environnement Python. Les termes clés pour travailler avec Python en science des données. Comment développer en Python? Comparatif Python / R. Les outils pour coder en Python. Python from scratch. Le langage orienté objet. Les structures. Les fonctions. Python et les données. La préparation des données et les premières statistiques. Utilisation du groupby pour décrire des données. Datavisualisation avec Python : le graphique comme outil de compréhension des données. Les graphiques interactifs avec bokeh. Le machine learning ou l'utilisation des algorithmes pour extraire de l'information. L'apprentissage supervisé avec Scikit Learn, Reco et TensorFlow. Python et le big data. Relations entre Python, Hadoop, MapReduce... Comment requêter des environnements big data avec Python.
Critique du livre par la rédaction djibril le 1er octobre 2019
Data scientist… le terme est lâché et il est à la mode ! Deux langages et environnements open source sont plus largement utilisés dans ce domaine : R et Python.

Ce livre, très didactique, est consacré à Python et à son utilisation en analyse de données. Il cible donc les professionnels de ce secteur, les statisticiens et développeurs qui souhaitent se spécialiser.

Les trois qualités principales de ce livre ? Il est en français, dirigé vers des applications métier et l’ensemble du code est disponible dans le repository github de l’auteur.

Il est construit en trois chapitres principaux. Le premier reprend les fondamentaux du langage, les outils et environnements de développement. Les explications sont assez claires et détaillées pour les habitués des lignes de code.

Le second chapitre est centré sur l’exploitation des données avec Python : stockage, statistiques, traitement et visualisation. Il est bien construit et permet de mettre en évidence les avantages du langage. C’est notamment le cas pour la visualisation, pour laquelle le package R ggplot2 est pour beaucoup une référence.

Le dernier chapitre est dédié à l’utilisation de Python pour le big data et le machine learning. Le propos n’est pas ici de détailler la théorie de ces méthodes mais plutôt de les illustrer avec différents algorithmes ou applications. Il a pour but de montrer en quoi Python est reconnu pour ces applications métier. La lecture de ce livre ne fera pas de vous le nouveau spécialiste big data mais vous incitera à vous diriger vers d’autres lectures plus spécialisées.

En conclusion, c’est un bon livre, bien écrit, qui répond au scientifique qui cherche à mettre en place un environnement de travail efficace pour exploiter ses données. Il peut notamment être conseillé aux adeptes de R qui souhaitent gagner en production et automatisation de code.




 Poster une réponse Signaler un problème

Avatar de djibril djibril - Responsable Perl et Outils https://www.developpez.com
le 01/10/2019 à 11:58
Python pour le data scientist
Des bases du langage au machine learning
Python est devenu en quelques années un langage majeur dans l'univers des applications centrées sur le traitement des données, et plus particulièrement des gros volumes de données (big data).
Cet ouvrage servira de guide à tous ceux qui s'intéressent à l'utilisation de Python pour le travail sur les données et l'automatisation de certaines tâches (data science). Il met l'accent sur la préparation et la mise en forme des données qui sont essentielles dans la qualité du résultat et qui constituent aujourd'hui une part importante du travail du data scientist.

L'ensemble des exemples et des exercices présentés dans cet ouvrage sont disponibles sous forme de Notebooks Jupyter. Ils sont accessibles directement sur GitHub dans le répertoire dédié à l'ouvrage ou en téléchargement sur le site Dunod.

[Lire la suite]