An asymptotically optimal policy for finite support models in the multiarmed bandit problem - researchr publication references

researchr

You are not signed in
Sign in
Sign up

Junya Honda, Akimichi Takemura. An asymptotically optimal policy for finite support models in the multiarmed bandit problem. Machine Learning, 85(3):361-391, 2011. [doi]

No references recorded for this publication.

No citations of this publication recorded.

runs on WebDSL