注册
登录
EN
|
中文
首页
论文提交
论文浏览
论文检索
个人中心
帮助
搜索
显示全部
确认邀请
取消邀请
添加新专家
发送邮件中...
确认回复
取消回复
*
专家姓名:
*
>专家邮箱:
*
专家机构:
*
研究领域:
请选择
物理学
天文学
生物学
数学
图书馆学、情报学
计算机科学
地球科学
其他
材料科学
能源科学
信息科学与系统科学
力学
化学
心理学
农、林、牧、渔
医学、药学
工程与技术科学
测绘科学技术
矿山工程技术
冶金工程技术
机械工程
动力与电气工程
核科学技术
电子与通信技术
化学工程
纺织科学技术
食品科学技术
土木建筑工程
水利工程
交通运输工程
航空、航天科学技术
环境科学技术及资源科学技术
安全科学技术
管理学
统计学
语言学及应用语言学
光学
护理学
法学
数字出版
药物科学
地球物理和空间物理
冰冻圈科学领域研究
*
专家学术主页:
联系方式:
确认添加
取消添加
开始评论:
公开评论
匿名评论
仅发给作者
评论提交
关闭评论
检索
您当前的位置: >
详细浏览
计及负荷不确定性的强化学习实时定价策略
请选择邀稿期刊:
邀请
关闭
作者:
王菁祺
1
高岩
1
吴志强
1
李仁杰
1
作者单位:
1.
上海理工大学 管理学院
提交时间:
2022-05-10 11:22:57
摘要:
面对当前电力系统的负荷不确定、新能源并网与“双碳”目标等现状,在充分考虑供需双方福利前提下,建立了智能电网背景下考虑负荷不确定与碳交易的实时定价模型。并基于强化学习能够处理变量复杂性、非凸非线性问题优点,采用强化学习中Q学习算法对模型进行迭代求解。首先,将用户与供电商实时交互过程转换为强化学习框架对应的马尔可夫决策过程。其次,通过智能体在动态环境中的反复探索表示用户与供电商的信息交互。最后,通过强化学习中的Q学习算法寻找最优值即最大社会福利值。仿真结果表明,所提实时定价策略能够有效提升社会福利,降低碳排放总量,这验证了所提模型和算法的有效性。
实时定价
强化学习
马尔可夫决策过程
负荷不确定
"双碳"目标
期刊:
计算机应用研究
分类:
计算机科学
>>
计算机科学的集成理论
引用:
ChinaXiv:202205.00076
(或此版本
ChinaXiv:202205.00076V1
)
DOI:10.12074/202205.00076V1
CSTR:32003.36.ChinaXiv.202205.00076.V1
推荐引用方式:
王菁祺,高岩,吴志强,李仁杰.(2022).计及负荷不确定性的强化学习实时定价策略.计算机应用研究.[ChinaXiv:202205.00076]
(点此复制)
版本历史
[V1]
2022-05-10 11:22:57
ChinaXiv:202205.00076V1
下载全文
相关论文推荐
1. Turing’s thinking machine and ’t Hooft’s principle of superposition of states
2024-05-14
2. 恶意代码SCMP分类方法框架与风险行为多标签机制
2024-05-09
3. Guiding Large Language Models to Generate Computer-Parsable Content
2024-04-23
4. SteganoDDPM: A high-quality image steganography self-learning method using diffusion model
2024-04-23
5. 引导大语言模型生成计算机可解析内容
2024-04-21
6. 基于大语言模型的中英文整合复杂性建模研究
2024-04-10
7. 大模型与标准文献知识库的融合应用探索
2024-04-10
8. 简体中文LIWC2024(SCLIWC2024)词典的修订与验证
2024-04-09
9. Multimodal Physical Fitness Monitoring (PFM) Framework Based on TimeMAE-PFM in Wearable Scenarios
2024-04-07
10. 引导大语言模型生成计算机可解析内容
2024-04-07
相关信息
点击下载全文
PDF
BIB
ZIP
预览
PDF
许可声明
ChinaXiv许可声明
metrics指标
点击量
541
下载量
243
评论
我要评论
分享
分享至: