Robo-Advising: Learning Investors’ Risk Preferences via Portfolio Choices*
https://doi.org/10.1093/jjfinec/nbz040
我們為零售機器人諮詢引入了強化學習框架。機器人顧問不知道投資者的風險偏好,但隨著時間的推移透過觀察她在不同市場環境中的投資組合選擇來了解它。我們開發了一種探索-利用演算法,該演算法在投資者對投資組合選擇的昂貴請求與基於投資者風險厭惡的陳舊估計的自主交易決策之間進行權衡。我們表明,該演算法構建的近似價值函式在狀態和動作空間中的多項式的多個週期內收斂到全知機器人顧問的價值函式。透過糾正投資者的錯誤,無論投資者做出投資組合決策的機會成本如何,機器人顧問都可能勝過獨立投資者