2024年度学院等開講科目情報理工学院数理・計算科学系知能情報コース

画像・映像認識

開講元: 知能情報コース
担当教員: 井上中順
授業形態: 講義 (ハイフレックス型)
メディア利用科目: -
曜日・時限 (講義室): 月1-2 (M-B45(H105)) / 木1-2 (M-B45(H105))
クラス: -
科目コード: ART.T551
単位数: 200
開講時期: 2024年度
開講クォーター: 4Q
シラバス更新日: 2025年3月14日
使用言語: 英語

シラバス

授業の目的（ねらい）、概要

本講義は，画像・映像認識に関する基礎的な概念と近年の技術進展を概観し，畳み込みニューラルネットワーク・領域提案ネットワーク・全層畳み込みネットワーク・敵対的生成ネットワークといった，深層学習モデルの仕組みを学ぶものである．また，授業と課題を通じて，深層学習のライブラリを用いたネットワークの学習方法を実践的に学ぶ．

到達目標

画像・映像認識に関する基礎的な概念について説明ができ，深層学習のライブラリを用いて実践的にネットワークの実装ができることを目標とする．

キーワード

深層学習，ニューラルネットワーク，画像認識，映像認識

学生が身につける力

専門力
教養力
コミュニケーション力
展開力 (探究力又は設定力)
展開力 (実践力又は解決力)

授業の進め方

画像・映像認識の概要およびその理論的な取扱いついて講義資料(スライド)を用いて講義する．

授業計画・課題

	授業計画	課題
第1回	画像・映像認識の概要	現在の画像・映像認識技術の概要を理解する
第2回	深層学習の基礎	深層学習および最適化の基礎を理解する
第3回	深層学習プログラミングの基礎	深層学習ライブラリ使用方法の基礎を理解する
第4回	画像分類	畳み込みニューラルネットワークの仕組みを理解する
第5回	損失関数と最適化	領域提案ネットワークの仕組みを理解する
第6回	物体検出	領域提案ネットワークの仕組みを理解する
第7回	物体検出のプログラミング	領域提案ネットワークのプログラム実装方法を理解する
第8回	画像セグメンテーション	全層畳み込みネットワークの仕組みを理解する
第9回	動作認識	映像から人物動作を認識する方法を理解する
第10回	画像生成	敵対的学習法の仕組みを理解する
第11回	画像生成のプログラミング画像生成	画像生成のプログラム実装方法を理解する
第12回	総合演習	深層学習の応用方法を理解する
第13回	Student workshop 1	演習および最終レポートの成果を発表して議論する。
第14回	Student workshop 2	演習および最終レポートの成果を発表して議論する。

準備学修(事前学修・復習)等についての指示

学修効果を上げるため，教科書や配布資料等の該当箇所を参照し，「毎授業」授業内容に関する予習と復習（課題含む）をそれぞれ概ね100分を目安に行うこと。

教科書

参考書、講義資料等

I. Goodfellow, Y. Benito, A. Courville, Deep Learning, MIT Press, 2016.
D. Foster, Generative Deep Learning, O'Reilly Media, 2019.

成績評価の方法及び基準

レポートにより評価する (100%)