人とエアホッケーの対戦を行うロボットの実現に向けて, パックを目的の位置に打ち返すための動作を強化学習を用いて獲得する手法を考案し, シミュレーション環境を用いて打ち返しの精度を検証した. 学習を三つのフェーズに分けて行うことで, 一度の学習では習得できないような動作を高精度に学習させることが可能となった.