Compatible natural gradient policy search-Reference-Cited by-同舟云学术

Compatible natural gradient policy search

Published:2019-05-20 Issue:8-9 Volume:108 Page:1443-1466
ISSN:0885-6125
Container-title:Machine Learning
language:en
Short-container-title:Mach Learn

Author:

Pajarinen Joni^ORCID,Thai Hong Linh,Akrour Riad,Peters Jan,Neumann Gerhard

Funder

Deutsche Forschungsgemeinschaft

H2020 European Research Council

Publisher

Springer Science and Business Media LLC

Subject

Artificial Intelligence,Software

Link

http://link.springer.com/content/pdf/10.1007/s10994-019-05807-0.pdf

Reference31 articles.

1. Abdolmaleki, A., Lioutikov, R., Peters, J., Lau, N., Reis, L., & Neumann, G. (2015). Model-based relative entropy stochastic search. In Advances in Neural Information Processing Systems (NIPS), MIT Press.

2. Abdolmaleki, A., Springenberg, J. T., Tassa, Y., Munos, R., Heess, N., & Riedmiller, M. (2018). Maximum a posteriori policy optimisation. In Proceedings of the international conference on learning representations (ICLR).

3. Akrour, R., Abdolmaleki, A., Abdulsamad, H., & Neumann, G. (2016). Model-free trajectory optimization for reinforcement learning. In Proceedings of the international conference on machine learning (ICML).

4. Akrour, R., Abdolmaleki, A., Abdulsamad, H., Peters, J., & Neumann, G. (2018). Model-free trajectory-based policy optimization with monotonic improvement. Journal of Machine Learning Research, 19(14), 1–25.

5. Amari, S. (1998). Natural gradient works efficiently in learning. Neural Computation, 10(2), 251–276.

Cited by 11 articles. 订阅此论文施引文献订阅此论文施引文献，注册后可以免费订阅5篇论文的施引文献，订阅后可以查看论文全部施引文献

1. Artificial neural network-based approach for prediction of nanomechanical properties of anodic coating on additively manufactured Al–10Si–Mg alloy;Modelling and Simulation in Materials Science and Engineering;2024-05-09

2. Nature Inspired Optimization in Context-Aware-Based Coronary Artery Disease Prediction: A Novel Hybrid Harris Hawks Approach;IEEE Access;2024

3. Enhancement of Scalability of SVM Classifiers for Big Data;Advances in Data Science and Analytics;2022-10-31

4. Smoothing policies and safe policy gradients;Machine Learning;2022-10-20

5. Non-smooth Bayesian learning for artificial neural networks;Journal of Ambient Intelligence and Humanized Computing;2022-06-25