トップページへ

2025年度 (最新) 学院等開講科目 情報理工学院 情報工学系 知能情報コース

コンピュータビジョン発展

開講元
知能情報コース
担当教員
金﨑 朝子 / 佐藤 育郎 / 池畑 諭 / 関川 雄介
授業形態
講義
メディア利用科目
-
曜日・時限
(講義室)
クラス
-
科目コード
ART.T476
単位数
200
開講時期
2025年度
開講クォーター
3Q
シラバス更新日
2025年4月2日
使用言語
英語

シラバス

授業の目的(ねらい)、概要

コンピュータビジョンとは計算機を使って光学的なセンサ入力から有用な情報を抽出するための技術の総称である.本講義では、画像データから三次元情報を復元する方法と点群データの処理方法を学ぶ.特に,これらの分野に関する深層学習技術について,授業と演習を通じて理解を深めていく.

到達目標

・画像からの三次元復元と点群処理に関する基礎的な概念についての説明ができる.
・ライブラリを用いて実践的にコンピュータビジョンモデルを活用できる.

実務経験のある教員等による授業科目等

実務経験と講義内容との関連 (又は実践的教育内容)

自動車関連企業において,物体追跡,画像検索,画像認識,画像分割,三次元復元などのコンピュータビジョン技術の研究開発を行ってきた(佐藤).

キーワード

三次元復元,点群処理,幾何的変換,深層学習

学生が身につける力

  • 専門力
  • 教養力
  • コミュニケーション力
  • 展開力 (探究力又は設定力)
  • 展開力 (実践力又は解決力)
  • コンピュータビジョン分野の発展的な内容とその実装方法について理解する。

授業の進め方

講義資料(スライド)とサンプルプログラムを用いて講義する.

授業計画・課題

授業計画 課題
第1回 三次元復元 (1/2) オプティカルフロー,エピポーラ幾何,特異値分解
第2回 三次元復元 (2/2) ステレオ平行化,バンドル調整,ロバスト推定
第3回 三次元復元演習 MATLABによる三次元復元アルゴリズムの実装
第4回 三次元データの入出力とレンダリング、幾何変換 Pythonライブラリを用いた三次元データ処理の基礎
第5回 サンプリングと法線推定 三次元データのサンプリングと物体の法線ベクトル推定
第6回 キーポイントと特徴量 キーポイント検出と特徴量抽出
第7回 点群レジストレーション(基礎) k-d木のデータ構造と最近傍探索、RANSAC、およびICPアルゴリズムの理解
第8回 点群レジストレーション(実践) 点群レジストレーションアルゴリズムの実装
第9回 姿勢推定、プリミティブ検出、セグメンテーション 点群データを用いた物体の姿勢推定、プリミティブ検出、セグメンテーション
第10回 深層学習モデルによる点群処理 PointNet等の深層学習モデルによる点群処理、点群畳み込み
第11回 RGBD、ボクセルデータ、メッシュ、マルチビュー画像、陰関数 3D点群以外の様々なデータ形式とNeRF等の陰関数
第12回 自動運転のためのビジョン 走行環境認識,行動計画
第13回 物理ベースドビジョン 光学特性,フォトメトリックステレオ
第14回 イベントベースドビジョン オドメトリ推定,SLAM

準備学修(事前学修・復習)等についての指示

学修効果を上げるため,教科書や配布資料等の該当箇所を参照し,「毎授業」授業内容に関する 予習と復習(課題含む)をそれぞれ概ね100分を目安に行うこと。

教科書

なし.

参考書、講義資料等

R. Hartley and A. Zisserman, Multiple View Geometry in Computer Vision, 2n ed., Cambridge University Press, 2004.
金崎朝子,秋月秀一,千葉直也,KS理工学専門書『詳解 3次元点群処理 Pythonによる基礎アルゴリズムの実装』,講談社,2022.

成績評価の方法及び基準

プレゼンテーションビデオ(70%)と出席点(30%)

関連する科目

  • XCO.T489 : 基盤人工知能
  • ART.T547 : マルチメディア情報処理論
  • ART.T463 : コンピューターグラフィクス
  • ART.T465 : スパース信号処理と最適化
  • ART.T475 : コンピュータビジョン基礎

履修の条件・注意事項

学部卒レベルの計算機科学ならびに線形代数・微積分・確率統計の知識があること.Python等のプログラミング言語を用いた実践演習を行うことができること.