製品システムの強化学習による階層型最適化

 最適製品システムを設計する場合、その製品システムの評価手法を用いて設計変数の最適化を行うことになる。このとき、製品システムが複雑になるにつれて最適化を行うための評価回数が飛躍的に増大する。そのため、製品システムの全体最適化は非常に困難を極める。さらに、評価手法としては、計算機の性能の向上とともに有限要素法を用いたシミュレーション技術の進歩が用いられその精度は向上しているが、非常に時間がかかる。

最適化時間 ≒ 評価回数 × 1回の評価時間

 これに対して、現状では最適化のアルゴリズムの向上によって評価回数の削減と、科学的な演繹的知識を用いた単純モデルを用いた1D-CAE等の簡易評価を用いた短時間評価手法の研究がなされている。しかし、現状の評価手法では複雑なシステムの設計の最適化では精度と時間という相反問題を解決することは困難である。

 そこで本研究では、製品システムの最適化に機械学習の強化学習を適用する新しい最適化手法を提案している。これは従来研究室で開発してきた製品システムをサブシステムに分解し、設計空間を分割し最適化しやすくし、個別のサブシステムの最適化と全体のシステムの最適化の階層に分けて最適化を行う階層型最適化手法により、評価回数の削減と最適化の精度の向上を図る手法への適用を意図している。しかし、本来強化学習はアルファGoなどのゲームや、車の自動運転などに当てはめられている手法で、環境に存在するシステムが環境に適応するための手法である。そのため、単純な適応は困難である。昨年度の研究で、階層型最適手法への強化学習の適用の可能性を明らかにしたので、本年は学習手法の高度化と適用範囲の拡大を試みる。さらに、機械学習による近似解析手法とリンクすることによりより演繹的知識帰納的知識を融合した高度な学習手法への展開も検討を行いたい。

必要となる知識:材料力学、多変量解析、最適化手法、機械学習

関連する論文:より詳細な内容を知りたい人はこちら