上野先生の研究成果がJournal of Advanced Computational Intelligence and Intelligent Informaticsに掲載されました

上野先生の研究成果がJournal of Advanced Computational Intelligence and Intelligent Informatics(JACIII)に掲載されました.

論文は上野先生が学生時代に指導教員と進めた研究の成果をまとめたもので,お世話になっている大学改革支援・学位授与機構の宮崎先生の企画された特集号”Special Issue on Cutting Edge of Reinforcement Learning and its Hybrid Methods”に合わせて執筆したものです.内容は逆強化学習(Inverse Reinforcement Learning)という,人間によるロボットの操作などを模倣するためにその軌跡のデータから強化学習における報酬関数を生成する技術を扱っています.具体的には,その軌跡のデータが不完全であるときにそれを補完して適切な行動を学習する方法を提案しています.

もしご興味あればご一読ください.

論文書誌情報

Fumito Uwano, Satoshi Hasegawa, and Keiki Takadama. “Inverse Reinforcement Learning with Agents’ Biased Exploration Based on Sub-Optimal Sequential Action Data,” Journal of Advanced Computational Intelligence and Intelligent Informatics (JACIII), vol. 28, no. 2, pp. 380-392, 2024.