“雙碳”背景下 ,光儲(chǔ)充電站逐漸成為未來充電站的一種主流形式 。為提高光儲(chǔ)充電站的經(jīng)濟(jì)效益并降低二 氧化碳 排放 ,提出了一種基于改進(jìn)深度強(qiáng)化學(xué)習(xí)的光儲(chǔ)充電站實(shí)時(shí)控制策略 。首先 ,建立以碳排放最小與運(yùn)行成本最低為目標(biāo)的優(yōu)化 模型并將其轉(zhuǎn)換為馬爾可夫決策過程;其次 ,提出了一種基于經(jīng)驗(yàn)繼承機(jī)制的粒子群優(yōu)化-深度確定性策略梯度算法(Particle swarm optimization-Deep Determini公tic Policy Gradient ,Pso-DDPG);最后 , 考慮動(dòng)態(tài)碳排放因子開展算例分析 ,驗(yàn)證了所 提Pso-DDPG策略的有效性。