L'IA DeepMind de Google apprend à dormir

11 Août 2017

Google est souvent en avance sur le reste du monde quand il s’agit d’intelligence artificielle.
Rappelez vous la surprenante victoire de son IA au jeu de Go contre le meilleur joueur mondial. Plus récemment, l’IA de Google a appris à utiliser son imagination et faire des prédictions.

La dernière nouveauté qu’a appris l’IA? Dormir !

Cela va peut être en surprendre plus d’un mais Google vient d’enseigner à DeepMind comment dormir.
A première vue, cela peut sembler inutile et contre productif de construire un agent artificiel qui ait besoin de «dormir». Après tout, ils sont censés continuer à résoudre nos problèmes de calcul bien après que leurs programmeurs soient allés au lit.
Mais cette technique de « repos » fut un élément clé pour « le réseau Deep Q » (DQN), un algorithme qui a appris à maîtriser des jeux Atari 2600.

DQN imitait « l’expérience de relecture », en stockant un sous-ensemble de données qu’il analysait « hors ligne »,  lui permettant d’apprendre de ses succès ou échecs « à tête reposé ».
Les chercheurs de DeepMind enseignent aux ordinateurs à apprendre par eux même. L’objectif final est d’emmener l’ordinateur à analyser et comprendre le problème puis de le solutionner sans aide extérieure. Comme pour l’Homme, l’apprentissage se base sur les échecs, les succès et le repos.

Les voitures autonomes comme objectif

Ces voitures devront prendre des décisions après avoir analysé un panel de donnée : Vitesse, obstacles, danger imminent, météo, autres voitures, piétons, signalisation, etc.
L’avantage du mode « offline » est double :

  • Il permettra à l’intelligence artificielle de la voiture de s’améliorer en apprenant de ses erreurs pour être plus performant lors des prochaines utilisations.
  • Il permettra également de garder en mémoire une certaine quantité de donnée non utilisée et les réutiliser à un autre moment. Une sorte de mode « offline » temporaire. Un exemple : Si la priorité est d’éviter un danger imminent, il est préférable que l’IA se concentre totalement sur cette tache que d’utiliser une partie de ses ressources sur l’économie de carburant.

l’IA doit être capable de penser et prendre des bonnes décisions comme une véritable personne.  Sinon, quel est le but de la recherche ?
Cette nouvelle méthode « offline » verra l’ordinateur utilisé normalement ses ressources fonctionnelles pour résoudre un problème. Mais l’avantage est qu’il pourra continuer à résoudre ce même problème alors qu’il sera hors ligne en économisant du temps et des ressources.
À l’avenir, lorsque votre ordinateur se mettra en mode veille, il pourrait être en train de résoudre votre problème du moment, ou créer le prochain …

Normandie Mkt Contact