#techno

Apprentissage par renforcement profond

5 mars 2021

L’apprentissage par renforcement profond est un apprentissage par renforcement appliqué à l’aide de réseaux de neurones profonds. Ce type d’apprentissage implique que les ordinateurs agissent sur des modèles sophistiqués et examinent un grand nombre d’entrées afin de déterminer un chemin ou une action optimisée.

 

Interagir avec l’environnement pour résoudre des problématiques business.

 

En intelligence artificielle, plus précisément en apprentissage automatique, l’apprentissage par renforcement consiste, pour un agent autonome (robot, etc.), à apprendre les actions à prendre, à partir d’expériences, de façon à optimiser une récompense quantitative au cours du temps. L’agent est plongé au sein d’un environnement, et prend ses décisions en fonction de son état courant. En retour, l’environnement procure à l’agent une récompense, qui peut être positive ou négative. L’agent cherche, au travers d’expériences itérées, un comportement décisionnel (appelé stratégie ou politique, et qui est une fonction associant à l’état courant l’action à exécuter) optimal, en ce sens qu’il maximise la somme des récompenses au cours du temps.

 

Présentation : Il s’agit d’un type de réseau neuronal qui interagit avec l’environnement en ayant recours à l’observation, aux actions et aux récompenses. L’apprentissage par renforcement profond (deep reinforcement learning, DRL) a été utilisé pour faire apprendre à des programmes des stratégies de jeu (Atari ou Go), et notamment pour entraîner le célèbre programme AlphaGo qui a battu un champion humain.

 

Intérêt : L’apprentissage par renforcement profond étant la plus générique des techniques d’apprentissage, peut être utilisé dans la plupart des applications business. Il nécessite moins de données que d’autres méthodes pour entraîner ses modèles. Fait encore plus notable, ce type de modèle peut être entraîné par simulation, ce qui élimine le besoin de données entièrement étiquetées. Au vu de ces bénéfices, nous constaterons davantage d’applications business combinant l’apprentissage par renforcement profond et la simulation fondée sur des agents émerger dans le courant de l’année.

 

 

Lire l’étude dans son intégralité :

https://www.pwc.fr/fr/decryptages/data/decouvrez-les-avancees-incontournables-en-matiere-dintelligence-artificielle.html

 

Vous devriez aimer

#métiers
La maintenance multitechnique et multiservice
#actu
Partenariat stratégique entre SamFM et Datapole
#actu
Industrie et maintenance prédictive
#actu
Le non entretien des équipements : impacts et coûts
#actu
DATAPOLE PARTICIPE AU SALON GLOBAL INDUSTRIE
#actu
5 avantages compétitifs de l’industrie 4.0