トップページへ

2021年度 学院等開講科目 情報理工学院 情報工学系 知能情報コース

コンピュータビジョン発展

開講元
知能情報コース
担当教員
川上 玲 / 佐藤 育郎 / 関川 雄介
授業形態
講義
メディア利用科目
-
曜日・時限
(講義室)
火7-8 / 金7-8
クラス
-
科目コード
ART.T552
単位数
200
開講時期
2021年度
開講クォーター
2Q
シラバス更新日
2025年7月10日
使用言語
英語

シラバス

授業の目的(ねらい)、概要

コンピュータビジョンとは計算機を使って画像や動画の入力から有用な情報を抽出するための技術の総称である。本講義では、画像理解と画像生成に関する特定の研究領域について学ぶ。コンピュータビジョンの最前線を学ぶ力を身に着けることをねらう。

到達目標

・基礎的な物体認識と物体追跡の手法を説明でき、かつ実装できる。
・本講義で紹介されたコンピュータビジョンの各分野について説明できる。

実務経験のある教員等による授業科目等

実務経験と講義内容との関連 (又は実践的教育内容)

自動車関連の企業において画像認識などを扱ってきた。

キーワード

画像検索、一般物体認識、物体追跡、畳み込みニューラルネットワーク、SLAM、イメージベースドレンダリング、コンピュテーショナルフォトグラフィ、自動運転、イベントカメラ

学生が身につける力

  • 専門力
  • 教養力
  • コミュニケーション力
  • 展開力 (探究力又は設定力)
  • 展開力 (実践力又は解決力)

授業の進め方

スライドを用いた講義とプログラミング演習を行う。

授業計画・課題

授業計画 課題
第1回 画像検索 Bag-of-Wordsと近似最近房探索について学ぶ。
第2回 一般物体認識 局所特徴記述子を利用した一般物体認識について学ぶ。
第3回 演習:物体認識 物体認識の基礎的な手法を実装する。
第4回 物体追跡 時系列フィルタを用いた物体追跡について学ぶ。
第5回 演習:物体追跡 物体追跡の処理を実装する。
第6回 畳み込みニューラルネットワーク 重み共有、プーリング、全結合、誤差逆伝搬法について学ぶ。
第7回 演習:ニューラルネットワーク ニューラルネットワークを実装する。
第8回 Visual SLAM (Simultaneous Localization And Mapping) 自己位置と三次元形状の同時最適化について学ぶ。
第9回 イメージベースドレンダリング 反射モデル、BRDF、光線空間について学ぶ。
第10回 コンピュテーショナルフォトグラフィ 超解像、ボケ除去について学ぶ。
第11回 画像のための機械学習 教師あり学習・教師なし学習・強化学習などについて学ぶ。
第12回 自動運転のための認識 自動運転に必要な認識タスクについて学ぶ。
第13回 イベントカメラ イベントカメラの基礎と応用について学ぶ。
第14回 コンピュータビジョンの最前線 最先端の論文を概説する。

準備学修(事前学修・復習)等についての指示

講義で学んだことを1時間程度復習すること。

教科書

なし。

参考書、講義資料等

講義スライドを授業時に共有する。
Richard Szeliski, Computer Vision: Algorithms and Applications, 2nd ed., Springer, 2011.
Richard Hartley and Andrew Zisserman, Multiple View Geometry in Computer Vision, 2nd ed., Cambridge University Press, 2004.

成績評価の方法及び基準

ファイナルレポート(40%)、3通のショートレポート(60%)

関連する科目

  • ART.T467 : コンピュータビジョン基礎
  • ART.T551 : 画像・映像認識
  • CSC.T439 : 拡張現実感
  • ART.T463 : コンピューターグラフィクス
  • XCO.T489 : 基盤人工知能
  • ART.T465 : スパース信号処理と最適化
  • ART.T547 : マルチメディア情報処理論

履修の条件・注意事項

コンピュータビジョンの基礎、ならびに線形代数・微積分・確率統計の知識があること。

連絡先 (メール、電話番号) ※”[at]”を”@”(半角)に変換してください。

isato[at]c.titech.ac.jp; reikawa[at]c.titech.ac.jp

オフィスアワー

水曜日11:30-12:00

その他

MATLABとPythonが使える環境を準備すること。