La compétition qui a opposé Lee Sedol, joueur coréen et légende du jeu de go à l’AlphaGo,  intelligence artificielle développée par une filiale de Google a connu de multiples rebondissements. Après avoir perdu trois parties consécutives, Lee Sedol a contre toute attente remporté la quatrième manche à Séoul (Corée du sud) à l’issue d’un match en 180 coups. C’est au 78ème coup que Sédol aurait placé un mouvement décisif qui a pris la machine par surprise et lui a ainsi assuré la victoire. AlphaGo a finalement annoncé forfait. C’est une victoire symbolique après trois victoires pour la machine. Mais celle-ci a imposé sa domination en remportant la dernière manche, et ce à quatre contre un lors d’un combat acharné de cinq heures. Le champion coréen, très mécontent de sa prestation, était considéré comme l’ultime rempart de l’humanité contre la machine.

Une prouesse technologique : le deep learning

Cette méthode d’apprentissage révolutionnaire basée sur des réseaux de neurones artificiels  a totalement bouleversé le domaine de l’intelligence artificielle, et ce en seulement quelques années. Afin de permettre cette prouesse technologique, il a fallu combiner les connaissances de chercheurs, d’ingénieurs, et utiliser les talents de brillants joueurs de go. C’est par toute une batterie de techniques ultra sophistiquées qu’a été battu Lee Sedol : l’apprentissage profond (ou deep learning), les techniques de Monte-Carlo ainsi que des techniques d’analyse de données massives (ou big data). Commençons par l’apprentissage profond : c’est une technique permettant d’entraîner des réseaux de neurones entiers, qui comprennent de nombreuses couches cachées. Le deep learning était initialement utilisé pour la reconnaissance de formes.

« Je n’ai jamais vu une révolution aussi rapide. On est passé d’un système un peu obscur à un système utilisé par des millions de personnes en seulement deux ans. » Yann LeCun, pionnier du deep learning.

Ces réseaux de neurones profonds sont capables de créer leurs propres représentations des caractéristiques d’un problème donné, pour arriver à des taux de réussite bien supérieurs que les autres méthodes. Mais ils demandent en revanche des tems d’apprentissage très longs, surtout pour les gros réseaux. Même si pour accélérer l’apprentissage, les concepteurs utilisent des cartes graphiques très puissantes comme Nvidia, les procédés durent toujours de quelques jours à plusieurs semaines. Le principe : la machine va jouer des millions de parties contre des versions différentes pour s’améliorer. Tout d’abord, elle apprend à trouver les coups d’excellents joueurs en consultant des milliers de parties. Le taux de reconnaissance est alors de 57 %. Ensuite, elle joue des parties contre elle-même afin de développer ce premier réseau de neurones, ce qui permet de générer de nouvelles données, utilisées à leur tous pour construire un second réseau. La difficulté est de combiner les deux réseaux en utilisant une technique plus classique, celle de Monte-Carlo afin de guider le jeu de l’ordinateur.

L’humain versus l’ordinateur, une histoire qui ne date pas d’hier

Le jeu de go était l’un des rares jeux où l’humain dominait encore la machine. On pense forcément à la victoire de la machine Deep Blue d’IBM sur le grand maître d’échecs Kasparov le 11 mai 1997. Ce jour-là, l’humiliation fut totale pour celui qui a déclaré que l’ordinateur ne serait jamais plus fort que l’homme. Mais si le russe peut à l’époque se vanter d’avoir été six fois champion du monde, il ne possède par la mémoire phénoménale de son adversaire, et perd la partie en seulement 19 coups.

Dans le jeu de go, il y a plus de combinaisons possibles pour gagner, que d’atomes dans l’univers.

Pourquoi cette victoire est-elle un évènement si important ?

Tout simplement car le jeu de go est très pertinent pour tester l’intelligence artificielle. C’est un jeu plutôt méconnu du grand public mais très populaire en Asie, et tout particulièrement en Corée. La difficulté du jeu de Go réside dans son plateau, le goban. C’est une grille de 19 lignes par 19 lignes et à l’intersection de ces lignes sont placées des pièces appelées pierres. Ainsi au départ, il y a plus de 361 positions possibles. Lorsqu’on lance une pierre, il reste donc 360 positions possibles, puis 359, et ainsi de suite à mesure que les pierres sont lancées. La machine cherche doit chercher un nombre de combinaisons astronomique pour gagner (l’arbre de décision). La particularité du programme AlphaGo de DeepMind est d’être capable de sélectionner les « branches » de l’arbre de décision qui offrent les meilleures chances de succès. La victoire de l’AlphaGo a surtout démontré que les techniques d’apprentissage automatiques et les systèmes de deep learning permettent à un système de se spécialiser très rapidement dans un domaine particulier.

Au-delà des jeux, cela pourrait s’avérer révolutionnaire dans le milieu de la santé, un domaine complexe qui nécessite d’apprendre une quantité d’information astronomique avant de devenir un expert, ce qui prend des années. L’intelligence artificielle pourrait permettre aux machines d’emmagasiner ces données beaucoup plus rapidement et avec plus de précision. Mais une machine est-elle capable de remplacer un médecin ? Cela reste à voir. L’intelligence artificielle, si elle ne sera pas capable de devenir « experte » pourrait éventuellement faire office de médecin généraliste.

À en croire une étude publiée dans la très sérieuse revue Artificial Intelligence in Medicine, des chercheurs ont réussi à créer une intelligence artificielle qui prescrit de meilleurs traitements que les médecins, de manière plus efficace et plus économique.

contact us btn icon

Passez à l'étape supérieure avec Alvexo Donnez nous la possibilité de vous contacter.

Ravi de vous rencontrer! Utilisez au moins 3 caractères
C'est bon! Quelque chose ne colle pas. Veuillez réessayer
x

On se connait déjà! Connectez-vous ou récupérez votre mot de passe

Êtes-vous sûr? Veuillez réessayer s’il vous plaît
+ -
A noter : Les opinions exprimées dans cet article sont celles de l'auteur et ne reflètent pas nécessairement le point de vue d'Alvexo