谷歌浏览器插件
订阅小程序
在清言上使用

基于强化学习TD3算法的投资组合管理

CHEN Hao,SHI Zhenghua

wf(2022)

引用 0|浏览0
暂无评分
摘要
针对投资组合管理问题,设计一种基于深度强化学习TD3(Twin Delayed Deep Deterministic policy gradient algo-rithm)双延迟确定性策略梯度算法的投资组合框架,投资者通过观察股票的因子信息做出决策以达到终期收益最大.因子选择上采用LGBM方法选取有效因子,模型训练过程通过数据增强的方法加强对环境的探索能力.选取两组股票做为风险资产,TD3策略在测试时期的年化收益均超过60%,夏普比率均超过2,综合来看TD3策略收益、风险控制、稳定性方面都要显著优于其他对照组(等权重、沪深300指数和DDPG策略),表明该策略在风险与收益的综合指标下有效.
更多
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要