1. [1] 三上貞芳: “強化学習のマルチエージェント系への応用,” 人工知能学会誌, Vol.12, No.6, pp. 845-849, 1997.
2. [2] 荒井幸代, 宮崎和光, 小林重信: “マルチエージェント強化学習の方法論―Q-LearningとProfit Sharingによる接近―,” 人工知能学会誌, Vol.13, No.4, pp. 609-617, 1998.
3. [3] 荒井幸代: “マルチエージェント強化学習―実用化に向けての課題・理論・諸技術との融合―,” 人工知能学会誌, Vol.16, No.4, pp. 476-481, 2001.
4. [4] R. S. Sutton and A. G. Barto: Reinforcement Learning, The MIT Press, 1998.
5. [5] J. Peters and S. Schaal: “Policy Gradient Methods for Robotics,” Proc. of Int. Conf. on Intelligent Robots and Systems (IROS), pp. 2219-2225, 2006.