2024年度 学院等開講科目 情報理工学院 数理・計算科学系 知能情報コース
画像・映像認識
- 開講元
- 知能情報コース
- 担当教員
- 井上 中順
- 授業形態
- 講義 (ハイフレックス型)
- メディア利用科目
- -
- 曜日・時限
(講義室) - 月1-2 (M-B45(H105)) / 木1-2 (M-B45(H105))
- クラス
- -
- 科目コード
- ART.T551
- 単位数
- 200
- 開講時期
- 2024年度
- 開講クォーター
- 4Q
- シラバス更新日
- 2025年3月14日
- 使用言語
- 英語
シラバス
授業の目的(ねらい)、概要
本講義は,画像・映像認識に関する基礎的な概念と近年の技術進展を概観し,畳み込みニューラルネットワーク・領域提案ネットワーク・全層畳み込みネットワーク・敵対的生成ネットワークといった,深層学習モデルの仕組みを学ぶものである.また,授業と課題を通じて,深層学習のライブラリを用いたネットワークの学習方法を実践的に学ぶ.
到達目標
画像・映像認識に関する基礎的な概念について説明ができ,深層学習のライブラリを用いて実践的にネットワークの実装ができることを目標とする.
キーワード
深層学習,ニューラルネットワーク,画像認識,映像認識
学生が身につける力
- 専門力
- 教養力
- コミュニケーション力
- 展開力 (探究力又は設定力)
- 展開力 (実践力又は解決力)
授業の進め方
画像・映像認識の概要およびその理論的な取扱いついて講義資料(スライド)を用いて講義する.
授業計画・課題
授業計画 | 課題 | |
---|---|---|
第1回 | 画像・映像認識の概要 | 現在の画像・映像認識技術の概要を理解する |
第2回 | 深層学習の基礎 | 深層学習および最適化の基礎を理解する |
第3回 | 深層学習プログラミングの基礎 | 深層学習ライブラリ使用方法の基礎を理解する |
第4回 | 画像分類 | 畳み込みニューラルネットワークの仕組みを理解する |
第5回 | 損失関数と最適化 | 領域提案ネットワークの仕組みを理解する |
第6回 | 物体検出 | 領域提案ネットワークの仕組みを理解する |
第7回 | 物体検出のプログラミング | 領域提案ネットワークのプログラム実装方法を理解する |
第8回 | 画像セグメンテーション | 全層畳み込みネットワークの仕組みを理解する |
第9回 | 動作認識 | 映像から人物動作を認識する方法を理解する |
第10回 | 画像生成 | 敵対的学習法の仕組みを理解する |
第11回 | 画像生成のプログラミング画像生成 | 画像生成のプログラム実装方法を理解する |
第12回 | 総合演習 | 深層学習の応用方法を理解する |
第13回 | Student workshop 1 | 演習および最終レポートの成果を発表して議論する。 |
第14回 | Student workshop 2 | 演習および最終レポートの成果を発表して議論する。 |
準備学修(事前学修・復習)等についての指示
学修効果を上げるため,教科書や配布資料等の該当箇所を参照し,「毎授業」授業内容に関する予習と復習(課題含む)をそれぞれ概ね100分を目安に行うこと。
教科書
-
参考書、講義資料等
I. Goodfellow, Y. Benito, A. Courville, Deep Learning, MIT Press, 2016.
D. Foster, Generative Deep Learning, O'Reilly Media, 2019.
成績評価の方法及び基準
レポートにより評価する (100%)
関連する科目
- ART.T458 : 先端機械学習
- XCO.T489 : 基盤人工知能
- XCO.T490 : 基盤人工知能演習
- XCO.T483 : 応用AI・データサイエンスA
- XCO.T485 : 応用AI・データサイエンスC
- XCO.T486 : 応用AI・データサイエンスD
履修の条件・注意事項
-