Autonomous 3D printed car using Nvidia Jetson Nano and Torch

Voici une de mes dernières réalisations.


... Lire plus

Installer un eGPU sur un Intel Nuc avec Ubuntu 18.04

image


... Lire plus

Devenir Atari Pong master grâce à l'apprentissage par renforcement

Qu'est-ce que l'apprentissage par renforcement ?

En apprentissage par renforcement, l'ordinateur essaye de déterminer les actions qui maximisent un nombre total de récompenses.

En trading par exemple, on évalue quelle stratégie va maximiser les récompenses qui sont le retour sur investissement. Les récompenses peuvent être obtenues longtemps après une action.

Autre exemple, avec un jeu d'échec, on peut obtenir des récompenses mieux que ce qu'on aurait pu jouer simplement en sacrifiant des pièces pour jouer un meilleur coup.

En apprentissage par renforcement, on crée une politique qui définit l’action qui maximisera les récompenses lorsqu'une action sera exécutée en fonction de l'état du système.

Atari Pong

Pour coder mon réseau de neurones et faire de l'apprentissage par renforcement sur un cas pratique et simple, j'ai utilisé le framework OpenAI gym.

“Gym is a toolkit for developing and comparing reinforcement learning algorithms”

Ce framework permet d'intéragir avec des jeux basiques Atari. J'ai choisi le jeu Atari Pong pour implémenter mon algorithme gradients de politique.

Voici 2 vidéos que j'ai enregistré qui montrent des parties jouées entre un agent qui est l'ordinateur et un agent qui est piloté par un réseau de neurones.

  • Dans la première vidéo, le réseau de neurones n'a pas encore été entraîné.
  • Dans la seconde vidéo, le réseau de neurones a été entraîné pendant des jours avec un algorithme policy gradients.


... Lire plus

Voiture autonome avec Unity et Keras


... Lire plus

Smart Gate ou comment ouvrir un portail électrique par reconnaissance faciale


... Lire plus

Ma présentation du Deep Learning

Ces dernières semaines j’ai été invité à parler de Deep Learning dans plusieurs entreprises des Hauts de France.

Ma présentation est publiques et accessible ci-dessous:

Vous trouverez ci-dessous les 2 des 3 vidéos que j'ai présenté durant la phase de démo de ma présentation. Les 2 apps font appel à des modèles Tensorflow. La première app est construite en Ionic. La seconde en React.


... Lire plus