トップページへ

2021年度 学院等開講科目 情報理工学院 数理・計算科学系 知能情報コース

先端人工知能

開講元
知能情報コース
担当教員
小野 功
授業形態
講義
メディア利用科目
-
曜日・時限
(講義室)
火3-4 / 金3-4
クラス
-
科目コード
ART.T548
単位数
200
開講時期
2021年度
開講クォーター
3Q
シラバス更新日
2025年7月10日
使用言語
英語

シラバス

授業の目的(ねらい)、概要

本講義では先端的な人工知能技術について学びます.具体的には,試行錯誤を通じて良好な解探索するアルゴリズムである進化計算,および,試行錯誤を通じて良好な行動戦略を獲得するアルゴリズムである強化学習について講義します.
本講義では,高度に知的なシステムを構築するための数理的・論理的知識と応用技術を横断的に修得させることをねらいとします.

到達目標

本講義を履修することによって,以下の数理的知識と応用技術を習得させる.
1) 進化計算技術
2) 強化学習技術

キーワード

進化計算,ブラックボックス最適化,多目的最適化,強化学習,価値ベースの手法,方策ベースの手法,深層強化学習

学生が身につける力

  • 専門力
  • 教養力
  • コミュニケーション力
  • 展開力 (探究力又は設定力)
  • 展開力 (実践力又は解決力)

授業の進め方

講義はスライドを使った講義と演習の併用によって進める。

授業計画・課題

授業計画 課題
第1回 進化計算入門 講義の目的と進化計算の基礎の理解
第2回 関数最適化のための進化計算:遺伝的アルゴリズム 関数最適化,遺伝的アルゴリズムの理解
第3回 関数最適化のための進化計算:進化戦略 進化戦略の理解
第4回 組合せ最適化のための進化計算:遺伝的アルゴリズム 組合せ最適化のための遺伝的アルゴリズムの理解
第5回 離散最適化のための進化計算:分布推定アルゴリズム ブラックボックス離散関数最適化のための分布推定アルゴリズムの理解
第6回 大域的多峰性最適化のための進化計算 大域的多峰性と大域的多峰性問題最適化のための進化計算の理解
第7回 多目的最適化のための進化計算 多目的最適化,多目的進化計算の理解
第8回 強化学習入門 強化学習の基礎の理解
第9回 深層ニューラルネットワーク 深層ニューラルネットワークの理解
第10回 Deep Q-Network (DQN) Deep Q-Network (DQN) の理解
第11回 DQNの改良 DQNの改良版の理解
第12回 方策勾配法とActor-Critic法 REINFORCE, A2C, A3Cの理解
第13回 Trust Region Policy OptimizationとProximal Policy Optimization Trust Region Policy Optimization (TRPO)とProximal Policy Optimization (PPO)の理解
第14回 Deep Deterministic Policy Gradient, Twin Delayed Deterministic Policy Gradient, Soft Actor-Critic Understand Deep Deterministic Policy Gradient (DDPG), Twin Delayed Deterministic Policy Gradient (TD3), Soft Actor-Critic (SAC)の理解

準備学修(事前学修・復習)等についての指示

学修効果を上げるため,教科書や配布資料等の該当箇所を参照し,「毎授業」授業内容に関する予習と復習(課題含む)をそれぞれ概ね100分を目安に行うこと。

教科書

教科書の指定はない。講義資料を配付する。

参考書、講義資料等

Artificial Intelligence - A Modern Approach (Third Edition, Prentice Hall) ほか

成績評価の方法及び基準

各講義で出題するレポートで評価する.

関連する科目

  • ZUS.I301 : 人工知能基礎

履修の条件・注意事項

JavaとPythonのプログラミング経験があることが望ましい。