由于非线性负载的广泛使用,电力系统中的谐波和功率因数降低的问题日益严重。针对上述问题,设计了一种RBF网络监督控制的三相并联有源电力滤波器(Shunt Active Power Filter,简称SAPF),用以抑制谐波和提高功率因数。首先,建立SAPF的数学模型,对谐波信号即控制信号进行RBF网络监督控制来控制开关的通断,通过Matlab仿真来证实该算法的有效性,神经网络通过DSP实现。
在深度强化学习方法中,针对内在好奇心模块(intrinsic curiosity model,ICM)指导智能体在稀疏奖励环境中获得未知策略学习的机会,但好奇心奖励是一个状态差异值,会使智能体过度关注于对新状态的探索,进而出现盲目探索的问题,提出了一种基于知识蒸馏的内在好奇心改进算法(intrinsic curiosity model algorithm based on knowledge distillation,KD-ICM)。首先,该算法引入知识蒸馏的方法,使智能体在较短的时间内获得更丰富的环境信息和策略知识,加速学习过程;其次,通过预训练教师神经网络模型去引导前向网络,得到更高精度和性能的前向网络模型,减少智能体的盲目探索。在Unity仿真平台上设计了两个不同的仿真实验进行对比,实验表明,在复杂仿真任务环境中,KD-ICM算法的平均奖励比ICM提升了136%,最优动作概率比ICM提升了13.47%,提升智能体探索性能的同时能提高探索的质量,验证了算法的可行性。