Résumé :
|
La 4e de couv. indique : "Dans cet ouvrage, les Big Data sont abord?ees du point de vue des applications, des m?ethodes d'analyse et de mod?elisation, des outils informatiques, et de l'optimisation de la programmation dans R et dans d'autres logiciels, dont Spark et H2O. Les principes de l'apprentissage profond sont d?etaill?es, et tout particuli?erement les r?eseaux de neurones convolutifs et r?ecurrents. On rappelle ce que sont la descente du gradient et le m?ecanisme de r?etropropagation, leurs difficult?es (sur-apprentissage, ?evanouissement du gradient) et les solutions apport?ees (dropout, normalisation par lot, activation ReLU[xe2][x80][xa6]). Les applications ?a la reconnaissance d'image et les architectures ?elabor?ees ces derni?eres ann?ees sont ensuite d?ecrites, de m?eme que des applications aux jeux de strat?egie et dans le domaine artistique avec les mod?eles g?en?eratifs.Ces m?ethodes sont ensuite mises en oeuvre avec trois des principales biblioth?eques d?apprentissage profond : MXNet, PyTorch et Keras-TensorFlow. On montre comment cr?eer et entra?iner un r?eseau convolutif, et comment l?appliquer ?a des probl?emes de classement d?images. On montre comment am?eliorer leur reconnaissance en recourant ?a l?augmentation de donn?ees et ?a l?apprentissage par transfert. On compare les r?esultats des m?ethodes profondes ?a ceux des m?ethodes ? classiques ? de machine learning : r?egression p?enalis?ee, for?ets al?eatoires, extra-trees, gradient boosting, SVM et perceptron. On montre aussi la puissance de calcul des processeurs graphiques (GPU). Le traitement du langage naturel commence ensuite par les questions linguistiques classiques : ?etiquetage grammatical, reconnaissance des entit?es nomm?ees, r?esolution des cor?ef?erences et lemmatisation. Puis viennent les repr?esentations vectorielles et les m?ethodes de plongements de mots. On parle aussi de la mod?elisation de th?ematiques, que l?on applique ?a ?A la recherche du temps perdu de Proust. Les r?eseaux de neurones r?ecurrents LSTM et GRU sont ensuite mis en oeuvre dans deux t?aches bien diff?erentes : la g?en?eration de texte et le classement de documents. Un aper?cu est donn?e de l?analyse de sentiments. L?analyse des r?eseaux sociaux et plus particuli?erement d?un corpus de tweets est vue comme convergence des m?ethodes de Big Data, de th?eorie des graphes et de traitement du langage naturel. L?ouvrage se conclut par une perspective sur l?intelligence artificielle, ?a la fois comme application des m?ethodes vues pr?ec?edemment et comme source de r?eflexions sur l??evolution et les d?efis de l?intelligence artificielle, et ce qui la s?epare de l?intelligence humaine."
|