【
儀表網(wǎng) 研發(fā)快訊】近期,中國科學院廣州能源研究所黃玉萍副研究員團隊在低碳電力系統(tǒng)的智能調度與決策領域取得了新進展。
當前,在配電網(wǎng)與微電網(wǎng)的運行主體存在本質差異的情況下,實現(xiàn)碳責任的公平分配仍然面臨巨大挑戰(zhàn)。此外,在去中心化的多主體配電網(wǎng)中,實現(xiàn)快速、高效且安全的低碳經(jīng)濟調度依然存在諸多障礙。
黃玉萍團隊構建了一個面向主動配電網(wǎng)與多微電網(wǎng)的協(xié)同優(yōu)化框架(圖1),結合時空碳強度均衡方法(STCIEM)和非合作優(yōu)化策略,分析了多主體協(xié)同決策中的碳排放分配問題。
圖1 多主體異構網(wǎng)絡協(xié)同運行示意圖
圖2 在離線訓練(a)和在線執(zhí)行(b)求解POMGs時的EAP-MATD3的架構
該研究通過引入增強動作投影多智能體雙延遲深度確定性策略梯度(EAP-MATD3)算法,成功解決了低碳優(yōu)化中的非凸性問題,優(yōu)化了決策性能。該算法通過優(yōu)化智能體目標,解決Actor-Critic失配問題,在生成符合物理系統(tǒng)約束的最優(yōu)決策方面,相比傳統(tǒng)的安全多智能體深度強化學習方法具有更優(yōu)表現(xiàn)。
圖3 EAP-MATD3在線執(zhí)行時ADN-MMG內部市場交易-碳強度結果
圖4 EAP-MATD3在線執(zhí)行時多個微電網(wǎng)內部電價-碳強度-能源運行優(yōu)化結果
研究表明,去中心化低碳決策中的協(xié)同優(yōu)化策略在提升系統(tǒng)效率和降低碳排放方面發(fā)揮了關鍵作用。然而,過度依賴單一安全約束策略(如純獎勵懲罰或簡單投影)可能導致 Actor-Critic 失配,降低學習效率并隱藏安全風險。EAP-MATD3算法能夠在復雜能源系統(tǒng)中有效平衡經(jīng)濟目標與環(huán)境目標,展現(xiàn)出更好的優(yōu)化性能。
本研究重點關注主動配電網(wǎng)與多微電網(wǎng)去中心化低碳運行中的復雜多主體協(xié)同決策和碳排放分配機制,為低碳電力系統(tǒng)的決策提供了參考依據(jù)。建議在低碳決策過程中合理平衡各主體自主優(yōu)化與全局效益,避免單一策略帶來的效率或安全問題;同時通過 STCIEM 確保碳責任公平分配,并借助 EAP-MATD3 優(yōu)化決策,以提升整體效率和穩(wěn)定性,保障低碳目標的實現(xiàn)。
研究得到了國家重點研發(fā)計劃、國家自然科學基金、廣東省發(fā)改委能源局項目等資助。
相關研究成果以Safe multi-agent deep reinforcement learning for decentralized low-carbon operation in active distribution networks and multi-microgrids為題發(fā)表于Applied Energy期刊,碩士研究生葉桐為第一作者,黃玉萍副研究員為通訊作者。
所有評論僅代表網(wǎng)友意見,與本站立場無關。