2024年度 学院等開講科目 情報理工学院 情報工学系 知能情報コース
画像・映像認識
- 開講元
- 知能情報コース
- 担当教員
- 井上 中順
- 授業形態
- 講義 (ハイフレックス型)
- メディア利用科目
- -
- 曜日・時限
(講義室) - 月1-2 (M-B45(H105)) / 木1-2 (M-B45(H105))
- クラス
- -
- 科目コード
- ART.T551
- 単位数
- 200
- 開講時期
- 2024年度
- 開講クォーター
- 4Q
- シラバス更新日
- 2025年3月14日
- 使用言語
- 英語
シラバス
授業の目的(ねらい)、概要
本講義は,画像・映像認識に関する基礎的な概念と近年の技術進展を概観し,畳み込みニューラルネットワーク・領域提案ネットワーク・全層畳み込みネットワーク・敵対的生成ネットワークといった,深層学習モデルの仕組みを学ぶものである.また,授業と課題を通じて,深層学習のライブラリを用いたネットワークの学習方法を実践的に学ぶ.
到達目標
画像・映像認識に関する基礎的な概念について説明ができ,深層学習のライブラリを用いて実践的にネットワークの実装ができることを目標とする.
キーワード
深層学習,ニューラルネットワーク,画像認識,映像認識
学生が身につける力
- 専門力
- 教養力
- コミュニケーション力
- 展開力 (探究力又は設定力)
- 展開力 (実践力又は解決力)
授業の進め方
画像・映像認識の概要およびその理論的な取扱いついて講義資料(スライド)を用いて講義する.
授業計画・課題
| 授業計画 | 課題 | |
|---|---|---|
| 第1回 | 画像・映像認識の概要 |
現在の画像・映像認識技術の概要を理解する |
| 第2回 | 深層学習の基礎 |
深層学習および最適化の基礎を理解する |
| 第3回 | 深層学習プログラミングの基礎 |
深層学習ライブラリ使用方法の基礎を理解する |
| 第4回 | 画像分類 |
畳み込みニューラルネットワークの仕組みを理解する |
| 第5回 | 損失関数と最適化 |
領域提案ネットワークの仕組みを理解する |
| 第6回 | 物体検出 |
領域提案ネットワークの仕組みを理解する |
| 第7回 | 物体検出のプログラミング |
領域提案ネットワークのプログラム実装方法を理解する |
| 第8回 | 画像セグメンテーション |
全層畳み込みネットワークの仕組みを理解する |
| 第9回 | 動作認識 |
映像から人物動作を認識する方法を理解する |
| 第10回 | 画像生成 |
敵対的学習法の仕組みを理解する |
| 第11回 | 画像生成のプログラミング画像生成 |
画像生成のプログラム実装方法を理解する |
| 第12回 | 総合演習 |
深層学習の応用方法を理解する |
| 第13回 | Student workshop 1 |
演習および最終レポートの成果を発表して議論する。 |
| 第14回 | Student workshop 2 |
演習および最終レポートの成果を発表して議論する。 |
準備学修(事前学修・復習)等についての指示
学修効果を上げるため,教科書や配布資料等の該当箇所を参照し,「毎授業」授業内容に関する予習と復習(課題含む)をそれぞれ概ね100分を目安に行うこと。
教科書
-
参考書、講義資料等
I. Goodfellow, Y. Benito, A. Courville, Deep Learning, MIT Press, 2016.
D. Foster, Generative Deep Learning, O'Reilly Media, 2019.
成績評価の方法及び基準
レポートにより評価する (100%)
関連する科目
- ART.T458 : 先端機械学習
- XCO.T489 : 基盤人工知能
- XCO.T490 : 基盤人工知能演習
- XCO.T483 : 応用AI・データサイエンスA
- XCO.T485 : 応用AI・データサイエンスC
- XCO.T486 : 応用AI・データサイエンスD
履修の条件・注意事項
-