Titre :
|
Restless bandits : activity allocation in a changing world
|
Titre original:
|
Les bandits sans repos : allocation optimale dans un monde changeant
|
Auteurs :
|
P. Whittle
|
Type de document :
|
article/chapitre/communication
|
Année de publication :
|
1988
|
Format :
|
287-298
|
Langues:
|
= Anglais
|
Catégories :
|
MATHEMATIQUES STATISTIQUES
|
Mots-clés:
|
SYSTEME DYNAMIQUE
;
MODELE PROBABILISTE
;
OPTIMISATION
|
Résumé :
|
Nous considérons une population de n projets qui, en général, continuent d'évoluer aussi bien en opération q'au repos. On désire déterminer les projets qu'il faut poursuivre à chaque instant, de manière à maximiser l'espérance du taux de récompense, sous une contrainte sur l'espérance du nombre de projets que l'on peut poursuivre simultanéement. Le multiplicateur de Lagrange associé à cette contrainte définie un indice qui se réduit à l'indice de Gittins quand les projets au repos sont statiques.
|
Source :
|
Journal of applied probabilities, vol 25
|