我们基于增强动态均值-方差框架开发了一个强化学习机器人顾问应用程序。机器人顾问提供面向零售投资者的数字财富管理服务,是财富管理行业快速增长的一部分。我们的明确目标是改善当前应用程序中的时间不一致性和非单调性的缺陷,同时保留因问卷调查而具有的直观吸引力、概率特性的图像表示和偏好可引出性。在投资中,预测未来的回报分布是最具挑战性的问题,但是,任何潜在分布都可以通过使用混合分布来进行良好的逼近,特别是如果我们能够确保混合分布的分量列表包括与潜在市场模式的情景分析相对应的所有可能分布。将开发新的机器学习算法以实现此目的。