本发明公开了一种基于多智能体合作的深度强化学习股票投资策略生成方法,通过多个模拟不同投资偏好的股票交易员的智能体,根据当前的市场状况给出投资策略,同时结合模拟风险控制人员的下跌风险预测模型给出的下跌风险预测结果,最后生成最终的投资策略。本发明还公开了实现上述投资策略生成方法的策略生成系统以及系统中的智能体模型。本发明方法通过多个不同投资偏好的智能体,综合考虑这些智能体根据当前的环境的投资建议,给出预测结果,之后再经过一个下跌风险预测的模型的二次校验,来降低投资策略的下跌风险。