Apprentissage par renforcement pour les processus décisionnels de Markov partiellement observés Apprendre une extension sélective du passé

Alain Dutech, Manuel Samuelides. Apprentissage par renforcement pour les processus décisionnels de Markov partiellement observés Apprendre une extension sélective du passé. Revue d Intelligence Artificielle, 17(4):559-589, 2003. [doi]