Concept information
Terme préférentiel
processus décisionnel de Markov
Définition
- Modèle aléatoire où un agent prend des décisions et où les résultats de ses actions sont aléatoires. Les PDM sont une extension des chaînes de Markov avec plusieurs actions à choisir par état et qui sont utilisés pour étudier des problèmes d'optimisation à l'aide d'algorithmes de programmation dynamique ou d'apprentissage par renforcement. (Data Franca)
Concept générique
Synonyme(s)
- MDP
- PDM
- processus de décision de Markov
- processus de décision markovien
Exemple
- Ce PDM comporte t=0 |Y| t états et t=0 |Y| t × |Y| actions (|Y| actions par état). (Knyazeva, Wisniewski & Yvon, 2015)
- Dans l'apprentissage automatique, l'environnement est modélisé comme un PDM. (Bouzid & Zribi, 2019)
- La figure 2 montre un exemple de représentation PDM pour le cas de 3 critères. (Bouzid & Zribi, 2019)
Traductions
-
anglais
-
MDP
URI
http://data.loterre.fr/ark:/67375/8LP-C7TXNDV0-V
{{label}}
{{#each values }} {{! loop through ConceptPropertyValue objects }}
{{#if prefLabel }}
{{/if}}
{{/each}}
{{#if notation }}{{ notation }} {{/if}}{{ prefLabel }}
{{#ifDifferentLabelLang lang }} ({{ lang }}){{/ifDifferentLabelLang}}
{{#if vocabName }}
{{ vocabName }}
{{/if}}