2021年度 学院等開講科目 情報理工学院 情報工学系 知能情報コース
コンピュータビジョン基礎
- 開講元
- 知能情報コース
- 担当教員
- 川上 玲 / 佐藤 育郎
- 授業形態
- 講義
- メディア利用科目
- -
- 曜日・時限
(講義室) - 火7-8 / 金7-8
- クラス
- -
- 科目コード
- ART.T467
- 単位数
- 200
- 開講時期
- 2021年度
- 開講クォーター
- 1Q
- シラバス更新日
- 2025年7月10日
- 使用言語
- 英語
シラバス
授業の目的(ねらい)、概要
コンピュータビジョンとは計算機を使って画像や動画の入力から有用な情報を抽出するための技術の総称である。本講義では、画像処理・画像特徴抽出・三次元形状復元・カメラ校正といったコンピュータビジョンの基礎について学ぶ。現在著しい発展を遂げている画像認識や画像生成の基礎となる技術の習得をねらう。
到達目標
・基礎的な画像処理・画像フィルタ・特徴抽出・三次元復元の手法を説明でき、かつ実装できる。
・画像の領域分割とカメラ校正について説明できる。
実務経験のある教員等による授業科目等
実務経験と講義内容との関連 (又は実践的教育内容)
自動車関連の企業において特徴抽出・三次元復元・カメラ校正などを扱ってきた。
キーワード
画像処理、画像フィルタリング、画像特徴、オプティカルフロー、エピポーラ幾何、ステレオマッチング、画像領域分割、カメラ校正
学生が身につける力
- 専門力
- 教養力
- コミュニケーション力
- 展開力 (探究力又は設定力)
- 展開力 (実践力又は解決力)
授業の進め方
スライドを用いた講義とプログラミング演習を行う。
授業計画・課題
授業計画 | 課題 | |
---|---|---|
第1回 | 導入 | コンピュータビジョンの全体像を俯瞰する。 |
第2回 | 画像処理の基礎 | デジタル画像処理の基礎を学ぶ。 |
第3回 | 演習:画像処理 | デジタル画像の基礎的な処理を実装する。 |
第4回 | フィルタリング | 平滑化やエッジ抽出などの二次元フィルタについて学ぶ。 |
第5回 | 演習:フィルタリング | 基礎的な画像フィルタを実装する。 |
第6回 | 画像特徴 | 代表的なキーポイント検出器や局所特徴記述子について学ぶ。 |
第7回 | 演習:画像特徴 | 代表的なキーポイント検出器や局所特徴記述子を実装する。 |
第8回 | オプティカルフロー | ルーカス・金出法などについて学ぶ。 |
第9回 | エピポーラ幾何 | 基礎行列と運動パラメタ推定について学ぶ。 |
第10回 | ステレオマッチング | ステレオカメラからの三次元復元について学ぶ。 |
第11回 | 演習:三次元復元 | 複数画像からの三次元復元処理を実装する。 |
第12回 | 領域分割 | レベルセットやグラフカットについて学ぶ。 |
第13回 | カメラ校正 | カメラの外部パラメタと内部パラメタの同定について学ぶ。 |
第14回 | 関連論文解説 | 本講義に関連する論文を概説する。 |
準備学修(事前学修・復習)等についての指示
講義で学んだことを1時間程度復習すること。
教科書
なし。
参考書、講義資料等
講義スライドを授業時に共有する。
Richard Szeliski, Computer Vision: Algorithms and Applications, 2nd ed., Springer, 2011.
Richard Hartley and Andrew Zisserman, Multiple View Geometry in Computer Vision, 2nd ed., Cambridge University Press, 2004.
成績評価の方法及び基準
ファイナルレポート(40%)、4通のショートレポート(60%)
関連する科目
- ART.T552 : コンピュータビジョン発展
- ART.T551 : 画像・映像認識
- ART.T463 : コンピューターグラフィクス
- XCO.T489 : 基盤人工知能
- ART.T465 : スパース信号処理と最適化
- ART.T547 : マルチメディア情報処理論
履修の条件・注意事項
学部卒レベルの計算機科学ならびに線形代数・微積分・確率統計の知識があること。
連絡先 (メール、電話番号) ※”[at]”を”@”(半角)に変換してください。
isato[at]c.titech.ac.jp; reikawa[at]c.titech.ac.jp
オフィスアワー
水曜日11:30-12:00
その他
MATLABとPythonが使える環境を準備すること。