我們基於增強動態均值-方差框架開發了一個強化學習機器人顧問應用程序。機器人顧問提供面向零售投資者的數字財富管理服務,是財富管理行業快速增長的一部分。我們的明確目標是改善當前應用程序中的時間不一致性和非單調性的缺陷,同時保留因問卷調查而具有的直觀吸引力、概率特性的圖像表示和偏好可引出性。在投資中,預測未來的回報分布是最具挑戰性的問題,但是,任何潛在分布都可以通過使用混合分布來進行良好的逼近,特別是如果我們能夠確保混合分布的分量列表包括與潛在市場模式的情景分析相對應的所有可能分布。將開發新的機器學習算法以實現此目的。