计及负荷不确定性的强化学习实时定价策略

作者： 王菁祺 ¹ 高岩 ¹ 吴志强 ¹ 李仁杰 ¹
作者单位：

1. 上海理工大学管理学院
提交时间：2022-05-10 11:22:57

摘要: 面对当前电力系统的负荷不确定、新能源并网与“双碳”目标等现状，在充分考虑供需双方福利前提下，建立了智能电网背景下考虑负荷不确定与碳交易的实时定价模型。并基于强化学习能够处理变量复杂性、非凸非线性问题优点，采用强化学习中Q学习算法对模型进行迭代求解。首先，将用户与供电商实时交互过程转换为强化学习框架对应的马尔可夫决策过程。其次，通过智能体在动态环境中的反复探索表示用户与供电商的信息交互。最后，通过强化学习中的Q学习算法寻找最优值即最大社会福利值。仿真结果表明，所提实时定价策略能够有效提升社会福利，降低碳排放总量，这验证了所提模型和算法的有效性。

实时定价强化学习马尔可夫决策过程负荷不确定 "双碳"目标

期刊： 计算机应用研究
分类： 计算机科学 >> 计算机科学的集成理论
引用： ChinaXiv:202205.00076 (或此版本 ChinaXiv:202205.00076V1)
DOI:10.12074/202205.00076V1
CSTR:32003.36.ChinaXiv.202205.00076.V1
推荐引用方式： 王菁祺,高岩,吴志强,李仁杰.(2022).计及负荷不确定性的强化学习实时定价策略.计算机应用研究.[ChinaXiv:202205.00076] (点此复制)

版本历史

[V1]

2022-05-10 11:22:57

ChinaXiv:202205.00076V1

下载全文

相关论文推荐

1. Turing’s thinking machine and ’t Hooft’s principle of superposition of states	2024-05-14
2. 恶意代码SCMP分类方法框架与风险行为多标签机制	2024-05-09
3. Guiding Large Language Models to Generate Computer-Parsable Content	2024-04-23
4. SteganoDDPM: A high-quality image steganography self-learning method using diffusion model	2024-04-23
5. 引导大语言模型生成计算机可解析内容	2024-04-21
6. 基于大语言模型的中英文整合复杂性建模研究	2024-04-10
7. 大模型与标准文献知识库的融合应用探索	2024-04-10
8. 简体中文LIWC2024(SCLIWC2024)词典的修订与验证	2024-04-09
9. Multimodal Physical Fitness Monitoring (PFM) Framework Based on TimeMAE-PFM in Wearable Scenarios	2024-04-07
10. 引导大语言模型生成计算机可解析内容	2024-04-07


公开评论匿名评论仅发给作者