paper

Data Efficient Training for Reinforcement Learning with Adaptive Behavior Policy Sharing

Ge Liu, Rui Wu, Heng-Tze Cheng, Jing Wang, Jayden Ooi

Data Efficient Training for Reinforcement Learning with Adaptive Behavior Policy Sharing

Name: Data Efficient Training for Reinforcement Learning with Adaptive Behavior Policy Sharing
Author: Ge Liu, Rui Wu, Heng-Tze Cheng, Jing Wang, Jayden Ooi

Ge Liu, Rui Wu, Heng-Tze Cheng, Jing Wang, Jayden Ooi

Paper2020-02-12English

Start Reading

deep learning portfolioarxiv

Description

Deep Reinforcement Learning (RL) is proven powerful for decision making in simulated environments. However, training deep RL model is challenging in real world applications such as production-scale health-care or recommender systems because of the expensiveness of interaction and limitation of budget at deployment. One aspect of the data inefficiency comes from the expensive hyper-parameter tuning when optimizing deep neural networks. We propose Adaptive Behavior Policy Sharing (ABPS), a data-ef...