Technologie

Deep learning

Le deep learning : késako ?

Ces dernières années, le deep learning fait des plus en plus parler de lui, si bien qu’il est fort probable que vous en aillez déjà entendu parler certains articles ou reportages.

Le deep learning est en fait une branche du machine learning (apprentissage machine) qui elle-même est une branche de l’intelligence artificielle. Le machine learning permet à un ordinateur d’apprendre par « essai erreur ». La plupart du temps, le deep learning se réalise à l’aide d’un algorithme appelé le réseau de neurones (ou une de ses variantes).

D’apparence assez simple, le deep learning est en fait une discipline complexe de part son implémentation (Codage des différents algorithmes) et son caractère abstrait .

Les réseaux de neurones : à quoi cela sert ?

Un réseau de neurones est en fait un modèle mathématique basé sur le fonctionnement des neurones humain.

Mais concrètement, à quoi peut bien servir un réseau de neurones ? La réponse est simple : ils sont utilisés pour réaliser des prédictions (classification ou régression). Nous pouvons par exemple différencier un chien d’un chat sur une photo (classification) ou encore estimer votre prime d’assurance (régression) …  Le deep learning se base sur ce modèle, dans lequel nous rentrons une quantité énorme d’informations. Les premiers modèles de réseaux de neurones datent déjà de la fin des années 50 mais les récentes évolutions technologiques l’ont rendu bien plus accessible, voilà pourquoi ils ne sont pas utilisés depuis plus longtemps.

Les réseaux de neurones : comment ça marche ?

Il s’agit de plusieurs couches de neurones interconnectées par des liens au travers desquelles l’information passe, pour ressortir le résultat attendu. L’information qui passe dans ce réseau est en fait une série de variables récoltées et liées à l’output (résultat) attendu. Par exemple pour estimer une prime d’assurance moto nous pouvons prendre en compte la localisation géographique ou encore l’âge du conducteur. Ces données doivent impérativement être correctes et pertinentes car les prédictions dépendent ce celles-ci.

Lors de son initialisation, un réseau de neurone ne réalise presque aucune prédiction correcte. Il doit d’abord passer par une étape d’apprentissage durant laquelle nous utilisons des données pour lesquelles nous connaissons déjà la solution (par exemple si nous voulons distinguer un chien d’un chat il nous faudra d’abord une série d’images pour lesquelles nous savons déjà de quel animal il s’agit). Les données sont passées à travers le réseau et celui-ci réalise une prédiction (souvent fausse au début), ensuite nous utilisons cette erreur (et la magie des mathématiques) pour modifier les différents paramètres (les liens reliant les neurones) petit à petit. Après qu’un nombre suffisant de données aient été utilisées pour modifier les poids nous pouvons tester le modèle sur de vraies données et celui-ci devrait être capable de faire des prédictions souvent avec une précision élevée. Avec cette méthode il est possible de créer des modèles très puissants, on peut par exemple citer un algorithme ayant appris à jouer aux échecs et capable de battre le champion du monde en titre, Garry Kasparov.

Sources :

https://www.second-glance.fr/2017/02/06/le-deep-learning-1-une-tentative-de-vulgarisation/

https://en.wikipedia.org/wiki/Deep_learning

http://www.yaronhadad.com/deep-learning-most-amazing-applications/

 

Commentaires