Accelerating deep reinforcement learning via knowledge-guided policy network-Reference-Cited by-同舟云学术

Accelerating deep reinforcement learning via knowledge-guided policy network

Published:2023-02-18 Issue:1 Volume:37 Page:
ISSN:1387-2532
Container-title:Autonomous Agents and Multi-Agent Systems
language:en
Short-container-title:Auton Agent Multi-Agent Syst

Author:

Yu Yuanqiang,Zhang Peng,Zhao Kai,Zheng Yan^ORCID,Hao Jianye

Funder

National Natural Science Foundation of China

Natural Science Foundation of Tianjin Municipal Science and Technology Commission

Natural Science Foundation of Tianjin City

Publisher

Springer Science and Business Media LLC

Subject

Artificial Intelligence

Link

https://link.springer.com/content/pdf/10.1007/s10458-023-09600-1.pdf

Reference51 articles.

1. Berenji, H. R. (1992). A reinforcement learning-based architecture for fuzzy logic control. International Journal of Approximate Reasoning, 6(2), 267–292.

2. Brockman, G., Cheung, V., Pettersson, L., Schneider, J., Schulman, J., Tang, J., & Zaremba, W. (2016). Openai gym

3. Celemin, C., & Ruiz-del Solar, J. (2019). An interactive framework for learning continuous actions policies based on corrective feedback. Journal of Intelligent & Robotic Systems, 95(1), 77–97.

4. Cheng, C.A., Yan, X., Wagener, N., & Boots, B. (2018). Fast policy learning through imitation and reinforcement. arXiv preprint arXiv:1805.10413

5. Collobert, R., Weston, J., Bottou, L., Karlen, M., Kavukcuoglu, K., & Kuksa, P. (2011). Natural language processing (almost) from scratch. Journal of Machine Learning Research, 12, 2493–2537.

Cited by 2 articles. 订阅此论文施引文献订阅此论文施引文献，注册后可以免费订阅5篇论文的施引文献，订阅后可以查看论文全部施引文献

1. Harnessing Deep Learning and Reinforcement Learning Synergy as a Form of Strategic Energy Optimization in Architectural Design: A Case Study in Famagusta, North Cyprus;Buildings;2024-05-09

2. Satisfiability of Arbitrary Public Announcement Logic with Common Knowledge is Σ^1_1-hard;Electronic Proceedings in Theoretical Computer Science;2023-07-11