マツダ技報2025
18/257

Soft Actor-Critic: Off-Policy Maximum Entropy Deep ）（3匠9――マツダ技報No.41（2025） Reinforcement Learning with a Stochastic Actor■著　者■上村和田幸史朗小林謙太藤井植木善治和田浩司好隆